Способ определения последовательности нуклеиновой кислоты (варианты) и набор для использования при определении последовательности нуклеиновой кислоты

 

В изобретении изложены способы и набор для быстрого и высокоэффективного создания последовательности нуклеиновой кислоты на основе гибридизации двумя наборами небольших проб олигонуклеотидов с известными последовательностями. Чрезвычайно большие молекулы нуклеиновых кислот, включая хромосомы и нерастворенные РНК, можно организовать в последовательности без предварительного клонирования и субклонирования. Способы согласно этому изобретению могут также позволить решить различные существующие проблемы, связанные с технологией создания последовательностей, такие, как, например, низкое значение отношения сигнал-шум и трудность избирательности, прикрепления многих фрагментов нуклеиновой кислоты к поверхности, приготовления многих более длинных или более сложных проб и нанесения меток на большее число веществ. 3 с. и 38 з.п.ф-лы, 10 ил.

Настоящая заявка является частичным продолжением одновременно рассматриваемой заявки на патент США 08/303.058, поданной 8 сентября 1994 г., которая является частичным продолжением заявки на патент США 08/127.420, поданной 27 сентября 1993 г.: весь текст и чертежи их специально включены сюда как ссылка без дискламации. Правительство США имеет право на настоящее изобретение согласно гранту Министерства энергетики LDRD 03235 и договору номер W-31-109-ENG-38 между Министерством энергетики США и Чикагским университетом, представляющим Национальную лабораторию Аргонн.

Настоящее изобретение в общем относится к области молекулярной биологии. В частности, изобретение предусматривает создание новых способов и соединений, позволяющих в высшей степени эффективное образование последовательностей молекул нуклеиновой кислоты. Способы согласно этому изобретению пригодны для организации последовательности длинных молекул нуклеиновых кислот, включая хромосомы и РНК, с процессами клонирования и субклонирования.

В настоящее время образование последовательности нуклеиновых кислот составляет неотъемлемую часть научного прогресса. Определение последовательности, т.е. первичной структуры, молекул и сегментов нуклеиновых кислот важно в отношении отдельных проектов, исследующих целый диапазон конкретных прикладных областей. Информация об организации последовательности влияет на науку, медицину, сельское хозяйство и на все области биотехнологии. Создание последовательности нуклеиновых кислот, конечно, жизненно важно для исследований по геному человека и для других крупномасштабных начинаний, цель которых - продвинуть наше понимание эволюции и функции организмов и помочь в понимании причин различных заболеваний.

Полезность организации последовательности нуклеиновых кислот очевидна. Например, Проект генома человека (ПГЧ), многонациональное начинание, посвященное созданию последовательности всего генома человека, осуществляется в различных центрах. Однако прогресс в этой области в основном и медленен и дорогостоящ. Организация последовательности нуклеиновых кислот обычно определяется на гелях полиакриламида, которые разделяют фрагменты ДНК в диапазоне 1 - 500 базовых пар с различием по длине на один нуклеотид. Реальное определение последовательности, т.е. порядок отдельных нуклеотидов A, G, C и T, можно достигнуть двумя способами. Во-первых, используя метод Максама и Гилберта химического расщепления фрагмента ДНК у конкретных нуклеотидов (Максам и Гилберт, 1977), или, во-вторых, используя метод создания последовательности окончанием цепочки дидеокси, описанный Сангером и коллегами (Сангер и др., 1977). Оба метода трудоемки и занимают много времени.

Недавно были предложены другие способы создания последовательности нуклеиновых кислот, в которых не используется этап электрофореза, и эти способы можно в общем назвать Создание последовательности гибридизацией или СПГ (Дрманач и др., 1991; Кантор и др., 1992; Дрманач и Черквеняков, патент США 5.202.231).

Развитие некоторых из этих методов вызвало появление новых инструментов создания последовательности типа твердой основы, известных как чипы создания последовательности. О полезности СПГ в основном свидетельствует тот факт, что по этой технологии были выданы патенты США. Однако, хотя СПГ потенциально может повысить скорость, с которой можно образовывать последовательности нуклеиновых кислот, все существующие методы СПГ имеют несколько недостатков.

СПГ можно проводить двумя основными способами, которые часто называют "формат 1" и "формат 2" (Кантор и др., 1992). В формате 1 олигонуклеотиды неизвестной последовательности, обычно около 100 - 1000 нуклеотидов в длину, выстраиваются на твердой основе или фильтре, так что сами неизвестные образцы связываются (нейтрализуются) (Стрезоска и др., 1991; Дрманач и Черквеняков, патент США 5.202.231). Реплики ряда затем "опрашиваются" гибридизацией наборами меченных проб длиной приблизительно 6-8 радикалов. В формате 2 чип образования последовательности образуется из набора олигонуклеотидов с известными последовательностями с длиной приблизительно 6-8 радикалов (Сазерн, WO 89/10977; Храпко и др., 1991; Сазерн и др., 1992). Нуклеиновые кислоты неизвестной последовательности затем мечутся и им позволяют гибридизироваться к связанным олиго.

К сожалению, оба эти формата СПГ имеют несколько ограничений, в частности, требование предшествующих этапов клонирования ДНК. В формате 1 к числу других значительных проблем относится прикрепление разных частей нуклеиновой кислоты, которую нужно организовать в последовательность, к твердой поверхности опоры или приготовление большого набора более длинных проб. В формате 2 к числу основных проблем относятся метки нуклеиновых кислот неизвестной последовательности, обычно высокое получающееся отношение сигнал-шум и то, что можно определить только короткие последовательности.

Еще одна проблема в формате 2 - это образование вторичной структуры, которая предотвращает доступ к некоторым целям, и разные условия, необходимые для проб с различным содержанием GC. Поэтому эта технология очевидным образом выиграет от создания новой процедуры для организации последовательности нуклеиновых кислот и, в частности, такой процедуры, которая позволяет избегать утомительные процессы клонирования или/и субклонирования.

Настоящее изобретение создано для преодоления этих и других недостатков, присущих предыдущим разработкам, путем создания новых способов и соединений для образования последовательности нуклеиновых кислот. Новейшие методы, описанные здесь, обычно назывались изобретателями "форматом 3" и они представляют собой заметное улучшение по сравнению с существующими методами СПГ формат 1 и формат 2. В формате 3 образования последовательности, обеспечиваемые этим изобретением, последовательности нуклеиновых кислот определяются посредством гибридизации с двумя наборами небольших проб олигонуклеотидов с известными последовательностями. Способ согласно изобретению позволяет получать высоко избирательную последовательность чрезвычайно больших молекул нуклеиновой кислоты, включая хромосомный материал или РНК, без предварительного клонирования, субклонирования или усиления. Кроме того, настоящие способы не требуют наличия большого количества проб, комплексного синтеза более длинных проб или мечения сложной смеси сегментов нуклеиновой кислоты.

Для того чтобы определить последовательность нуклеиновой кислоты согласно способам этого изобретения, в основном находятся последовательности от нуклеиновой кислоты путем гибридизации с дополняющими последовательностями от двух наборов небольших проб олигонуклеотидов (олиго) с определенной длиной и известной последовательностью, которые включают в себя большинство комбинаций последовательностей для этой длины пробы. Затем анализируются найденные последовательности для определения перекрывающихся протяженностей найденных последовательностей и реконструируется или собирается полная последовательность нуклеиновой кислоты из таких перекрывающихся последовательностей.

Способы образования последовательности можно выполнять с использованием последовательной гибридизации с дополнительными последовательностями из двух наборов небольших олиго. В качестве альтернативы можно применять способ, описываемый как "проведение цикла (чередование)", когда два набора небольших олиго гибридизируются одновременно с неизвестными последовательностями. Термин "проведение цикла" употребляется, поскольку избирательная часть метода возникает из последующего повышения температуры для "расплавления" тех гибридов, которые некомплементарны. Такие методы проведения цикла обычно применяются в других областях молекулярной биологии, таких, как PCR, и их легко поймут специалисты при чтении этого описания.

Это изобретение применимо для образования последовательности молекул нуклеиновой кислоты очень большой длины. На практике молекула нуклеиновой кислоты, последовательность которой нужно образовать, в основном разделяется на фрагменты для получения фрагментов нуклеиновой кислоты малой или промежуточной длины, которыми легко манипулировать.

Понятие фрагмент нуклеиновой кислоты, как он здесь используется, обычнее всего означает молекулу нуклеиновой кислоты длиной приблизительно от 10 базовых пар (бп) до 100 бп. Считается, что самые предпочтительные способы это те, в которых молекула нуклеиновой кислоты, последовательность которой нужно организовать, обрабатывается для получения фрагментов нуклеиновой кислоты промежуточной длины, т.е. приблизительно от 10 бп до 40 бп. Однако следует подчеркнуть, что настоящее изобретение это не способ полного образования последовательности небольших фрагментов нуклеиновой кислоты, скорее это способ образования последовательности молекул нуклеиновой кислоты как таковой, что предполагает определение частей последовательности изнутри молекулы - будь то осуществление с использованием целой молекулы или, для простоты, достигается начальным фрагментированием молекулы на участки меньшего размера приблизительно от 4 до 1000 баз.

Последовательности из молекул нуклеиновой кислоты определяются путем гибридизации к небольшим пробам олигонуклеотидов с известной последовательностью. Когда говорят о "небольших пробах олигонуклеотидов", термин "небольшие" означает пробы с длиной менее 10 бп и предпочтительно пробы длиной около 4 бп и около 9 бп. В одном примере образования последовательности особенно пригодными считаются пробы длиной около 6 бп. Для наборов олиго, включающих в себя все комбинации последовательностей для выбранной длины пробы, их число будет представлено как 4F, где F это длина пробы. Например, для 4-мера набор будет содержать 256 проб; для 5-мера набор будет содержать 1024 проб; для 6-мера - 4096 проб; для 7-мера - 16384 проб и т.д. Синтез олиго такой длины является вполне рутинным в технике и его можно осуществлять автоматизированным синтезом.

В способах согласно этому изобретению один набор небольших проб олигонуклеотидов с известной последовательностью, который можно назвать первым набором, будет прикрепляться к твердой основе, т.е. связываться (нейтрализоваться) на этой основе таким образом, что он может участвовать в реакциях гибридизации. Другой набор небольших проб олигонуклеотидов с известной последовательностью, который можно назвать вторым набором, это пробы, находящиеся в растворе и меченные обнаруживаемой меткой. Наборы олиго могут содержать пробы одинаковой длины или разных длин.

Процесс последовательной гибридизации означает, что молекулы нуклеиновой кислоты или фрагменты с неизвестной последовательностью можно гибридизировать к определенным наборам проб олигонуклеотидов с известными последовательностями в отдельные периоды времени (фиг. 1). Молекулы или фрагменты нуклеиновой кислоты в основном будут денатурированы, позволяя гибридизацию, и будут добавляться к первому, связанному набору проб при условиях избирательной гибридизации с обеспечением того, что гибридизируются только фрагменты с дополняющими последовательностями. Фрагменты с некомплементарными последовательностями удаляются и затем проводится следующий цикл избирательной гибридизации путем добавления второго, меченного, набора проб в раствор к уже образованной комбинации фрагментов и проб. Меченные пробы, которые гибридизируются рядом с фиксированной пробой, останутся прикрепленными к основе и могут быть обнаружены, чего не происходит, когда имеется промежуток между фиксированными и меченными пробами (фиг. 1).

Процесс одновременной гибридизации означает, что молекулы нуклеиновой кислоты неизвестной последовательности могут контактировать с определенными наборами проб олигонуклеотидов с известными последовательностями одновременно.

Гибридизация происходит при условиях избирательной гибридизации. Затем фрагменты с некомплементарными (не дополняющими) последовательностями "расплавляются", т. е. удаляются при повышении температуры, и затем проводится следующий этап избирательной гибридизации, позволяющий гибридизироваться любым вторым дополнительным пробам. Затем меченые пробы, которые гибридизировались рядом с фиксированной пробой, обнаруживаются таким же образом.

Последовательности нуклеиновой кислоты, являющиеся "дополняющими (комплементарными)", это те, которые способны к спариванию баз согласно стандартным правилам комплементарности Уотсона-Крика и вариантам этих правил, насколько они применимы к модифицированным базам. Это значит, что большие пурины или модифицированные пурины всегда будут спариваться по базе с меньшими пиримидинами с образованием только известных комбинаций. К ним относятся стандартный парис гуанина, спаренный с цитозином (G:C), и аденин, спаренный либо с тимином (A:T), в случае ДНК, либо с урацилом (A:U), в случае РНК. Также рассматривается использование модифицированных баз или так называемой "универсальной базы (основы)" (М. Николс и др., 1994).

Используемый здесь термин "дополняющие (комплементарные)" последовательности означает последовательности нуклеиновой кислоты, которые в принципе являются дополняющими по всей своей длине и имеют очень мало несовпадений баз. Например, последовательности нуклеиновой кислоты с 6-ю базами по длине можно назвать дополняющими, если они гибридизируются в пяти из шести положений только с одним несовпадением. Естественно, последовательности нуклеиновой кислоты, которые являются "полностью дополняющими", это те последовательности нуклеиновой кислоты, которые являются полностью дополняющими по всей своей длине и не имеют несовпадений баз.

После идентификации путем гибридизации к олиго с известными последовательностями разных отдельных последовательностей, составляющих часть фрагментов нуклеиновой кислоты, затем эти отдельные последовательности анализируются для нахождения перекрывающихся протяженностей последовательностей. Например, участки последовательностей, в которых конец 5' тот же самый, что и конец 3' другой последовательности или наоборот, идентифицируются. Полная последовательность молекулы или фрагмента нуклеиновой кислоты затем может оконтуриваться, т.е. она может реконструироваться из определенных таким образом перекрывающихся последовательностей.

Процессы нахождения перекрывающихся последовательностей и реконструирования полной последовательности обычно определяются вычислительным анализом. Например, если меченая проба 5'-TTTTTT-3' гибридизируется к месту, содержащему фиксированную пробу 5'-AAAAAA-3', определяется 12-мерная последовательность изнутри молекулы нуклеиновой кислоты, а именно, 5'-AAAAAATTTTTT-3' (посл. ид. N. 1), т.е. последовательность двух гибридизированных проб комбинируется, чтобы обнаружить ранее неизвестную последовательность. Следующий вопрос, на который нужно ответить, это какой нуклеотид идет следующим после только что определенной последовательности 5'-AAAAAATTTTTT-3' (посл. ид. N. 1). Имеются четыре возможности, представленные фиксированной пробой 5'-AAAAAT-3' и мечеными пробами 5'-TTTTTA-3' для A; 5'-TTTTTT-3' для T; 5'-TTTTTC-3' для C; и 5'-TTTTTG-3' для G. Если, например, проба 5'-TTTTTC-3' положительна, а другие три отрицательны, то собранная последовательность расширяется до 5'-AAAAAATTTTTTC-3' (посл. ид. N.2). На следующем этапе алгоритм определяет, какие из меченых проб TTTTCA, TTTTCT, TTTTCC или TTTTCG положительны в месте, содержащем фиксированную пробу AAAATT.

Этот процесс повторяется пока все положительные (F+P) последовательности олигонуклеотидов не используются или не будут определены как ложно положительные.

Таким образом, это изобретение создает очень эффективный способ организовывать последовательность фрагментов и молекул нуклеиновой кислоты большой длины. Как здесь определено, большие молекулы нуклеиновой кислоты - это такие молекулы, которые нужно разделять на фрагменты до создания последовательности. Их длина обычно составляет, как минимум, приблизительно 45 или 50 базовых пар (БП), а чаще всего и больше. Фактически способы согласно изобретению можно использовать, чтобы организовывать последовательность молекул нуклеиновой кислоты практически без верхнего предела длины, так что можно образовывать последовательности около 100 бп, 1 килобазы (кб), 100 кб, 1 Мегабазы (Мб) и 50 Мб и более, до полных хромосом, включительно, таких, как хромосомы человека, имеющие в длину около 100 Мб. Такое большое количество вполне находится в рамках настоящего изобретения, и образование последовательности такого количества баз потребует 2 набора 8-меров или 9-меров (так что F+P приблизительно равно 16-18). Подлежащие образованию последовательности нуклеиновые кислоты могут быть ДНК, например, сДНК, геномная ДНК, микрорасчлененные хромосомные полосы, космидные ДНК или вставки YAC, или могут быть РНК, включая mРНК, rРНК, tРНК или snРНК.

Процесс определения последовательности длинной молекулы нуклеиновой кислоты предполагает просто нахождение последовательностей с длиной F+P из молекулы и комбинирование последовательностей с использованием подходящего алгоритма. На практике сначала скорее всего разделяют на фрагменты молекулу нуклеиновой кислоты, последовательность которой нужно сформировать, для получения меньших фрагментов, таких, как фрагменты нуклеиновой кислоты с промежуточной длиной. Затем находятся последовательности с длиной F+P гибридизацией, например, последовательной гибридизацией фрагментов к дополняющим последовательностям из 2-х наборов небольших проб олигонуклеотидов с известной последовательностью, как описано выше. Таким образом, можно реконструировать полную последовательность нуклеиновой кислоты чрезвычайно больших молекул из перекрывающихся последовательностей с длиной F+P.

Независимо от того, является ли нуклеиновая кислота, последовательность которой нужно организовать, сама фрагментом с промежуточной длиной или ее вначале обработали, чтобы получить фрагменты с такой длиной, процесс нахождения последовательностей из таких фрагментов нуклеиновых кислот путем гибридизации двух наборов небольших проб олигонуклеотидов с известной последовательностью является основным для описываемых здесь методов образования последовательности. Этот процесс обычно включает в себя следующие этапы: а) приведение набора или ряда прикрепленных или связанных (нейтрализованных) проб олигонуклеотидов в контакт с фрагментами нуклеиновой кислоты в условиях гибридизации, эффективных для того, чтобы позволить фрагментам с дополняющей последовательностью достаточно гибридизироваться к пробе, что образует первичные комплексы, где фрагмент имеет как гибридизированные, так и негибридизированные, или "свободные", последовательности; б) приведение первичных комплексов в контакт с набором меченых проб олигонуклеотидов в растворе в условиях гибридизации, эффективных для того, чтобы позволить пробам с дополняющими последовательностями гибридизироваться к негибридизированной или свободной последовательности фрагмента, что образует вторичные комплексы, где фрагмент гибридизирован, и к прикрепленной (связанной) пробе и к меченой пробе; в) удаление из вторичных комплексов любых меченых проб, которые не были гибридизированы рядом с прикрепленной пробе, что оставляет только соседние вторичные комплексы; г) обнаружение соседних вторичных комплексов путем обнаружения наличия метки в меченой пробе; и д) нахождение последовательностей олигонуклеотидов из фрагментов нуклеиновой кислоты в соседних вторичных комплексах путем комбинирования или соединения известных последовательностей гибридизированных и меченых проб.

Гибридизация или "условия промывки", выбранные для проведения одного или двух этапов гибридизации, может осуществляться согласно конкретно выбранному примеру образования последовательности. Например, оба условия гибридизации могут быть организованы так, чтобы позволить пробам олигонуклеотида гибридизироваться к данному фрагменту нуклеиновой кислоты, когда они содержат дополняющие последовательности, например, в принципе совпадающие последовательности, например, такие последовательности, которые гибридизируются у 5-ти из 6-ти положений. Предпочтительно этапы гибридизации проводят, используя простое робототехническое устройство, которое обычно применяется в существующих процедурах образования последовательностей.

В качестве альтернативы условия гибридизации могут быть организованы так, чтобы позволить гибридизацию только тем пробам и фрагментам олигонуклеотидов, которые имеют полностью дополняющие последовательности. Эти более избирательные или "строгие" условия можно использовать для обоих отдельных этапов процесса последовательной гибридизации или только для каждого одного этапа. В таких случаях пробы олигонуклеотидов, будь то связанные или меченые пробы, смогут гибридизировать только к данному фрагменту нуклеиновой кислоты, если они имеют общие полностью дополняющие последовательности с фрагментом.

Выбранные условия гибридизации в основном диктуют степень сложности, требуемую для анализа полученных данных. В равной степени компьютерные программы, имеющиеся для анализа любых сформированных данных, могут диктовать условия гибридизации, которые нужно применять в данной лаборатории. Например, в самом избирательном процессе оба этапа гибридизации будут проводиться в условиях, позволяющих гибридизировать только олиго и фрагменты с полностью дополняющими последовательностями. Поскольку несовпадающих баз не будет, этот способ подразумевает наименее сложный вычислительный анализ и по этой причине это в настоящее время предпочтительный способ применения изобретения на практике. Однако применение менее избирательных условий для одного или обоих этапов гибридизации также входит в рамки этого изобретения.

Подходящие условия гибридизации для применения на одном из этапов или на обоих могут обычно определяться процедурами оптимизации или первыми из серии исследований. Разные виды первых исследований обычно проводятся специалистами по организации последовательностей нуклеиновых кислот при установлении рабочих процедур и адаптации процедуры для данной лаборатории. Например, такие условия, как температура; концентрация каждого из компонентов; продолжительность времени этапов; применяемые буферы и их pH и прочность на ионы могут меняться и тем самым оптимизироваться.

В предпочтительных примерах осуществления способ образования последовательности нуклеиновой кислоты согласно этому изобретению включает в себя выборочный этап для отбора вторичных комплексов гибридизации, которые содержат непосредственно соседствующие связанные и меченые пробы, в отличие от тех, которые не являются непосредственно соседними и разделены одной, двумя или несколькими базами.

Имеется много разных процессов для удаления меченых проб, которые не гибридизировались непосредственно рядом с прикрепленной пробой, т.е. не гибридизировались задними сторонами, каждый из которых оставляет только непосредственно соседние вторичные комплексы.

Такие избирательные процессы могут основываться исключительно на этапах промывки с контролируемой строгостью, где применяемые условия гибридизации организованы так, что непосредственно соседние пробы остаются гибридизированными благодаря повышенной стабильности, создаваемой взаимодействиями между наборами соседних нуклеотидов. Опять же такие условия промывки, как температура, концентрация, время, буферы, pH прочность на ионы и т.п. можно менять, чтобы оптимизировать удаление меченых проб, которые не являются непосредственно соседними.

В предпочтительных примерах осуществления изобретения непосредственно соседние связанные и меченые пробы будут связаны, т.е. объединены ковалентной связью до выполнения этапов промывки для удаления любых не образовавших связи проб. Образование связей может достигаться путем обработки раствором, содержащим химическое связующее вещество, например, растворимый в воде карбодиимид или цианоген бромид. Предпочтительно можно использовать фермент лигазы, такой, как лигаза T4 ДНК из бактериофага T4, который промышленно поставляется многими фирмами (например, Biolabs). В любом случае затем можно будет удалить не непосредственно соседние меченые пробы посредством более строгих условий промывки, которые не могут воздействовать на ковалентно соединенные меченые и фиксированные пробы.

Остающиеся соседние вторичные комплексы будут обнаруживаться наблюдением за нахождением метки из меченых проб, присутствующих внутри комплексов. Пробы олигонуклеотидов могут метиться химически обнаруживаемой меткой, такой как флюоресцентными красителями, или адекватно модифицированными для их обнаружения процедурами хемилюминесцентного проявления, или радиоактивными метками, такими, как 35S, 3H, 32P или 33P, хотя сейчас предпочтителен 33P. Пробы могут также метиться нерадиоактивными изотопами и обнаруживаться масс-спектрометрией.

В настоящее время наиболее предпочтительный рассматриваемый способ осуществления на практике этого изобретения предполагает осуществление этапов гибридизации в условиях, предназначенных для того, чтобы позволить гибридизировать только тем пробам и фрагментам олигонуклетидов, которые имеют полностью дополняющие последовательности, и позволить оставаться гибридизированными только непосредственно соседним пробам. Этот способ вследствие этого требует наименее сложного вычислительного анализа.

Если молекула нуклеиновой кислоты с неизвестной последовательностью длинее чем около 45 или 50 бп, один эффективный способ определения ее последовательности обычно предполагает обработку молекулы для формирования фрагментов нуклеиновой кислоты промежуточной длины и определение последовательностей из фрагментов. Молекула нуклеиновой кислоты, буть то ДНК или РНК, может быть разделена на фрагменты любым из многочисленных способов, включая, например, разрезанием ограничительным ферментным вывариванием, сдвигом (скалыванием) физическими средствами, такими, как сверхзвуковая обработка, обработкой NaOH или сдвигом при низком давлении.

В некоторых примерах осуществления изобретения, например, при наличии небольших проб олигонуклеотидов длиной приблизительно от 4 бп до 9 бп можно иметь целью получить фрагменты нуклеиновой кислоты длиной приблизительно от 10 бп до 40 бп. Естественно, более длинные пробы в основном будут использоваться в сочетании с образованием последовательности более длинных фрагментов нуклеиновой кислоты и наоборот. В некоторых предпочтительных примерах осуществления используемые небольшие пробы олигонуклеотидов будут иметь длину около 6 бп, а фрагменты нуклеиновой кислоты, последовательность которых нужно организовать, будут иметь длину в основном около 20 бп. При желании фрагменты можно разделять по размерам, чтобы получить фрагменты соответствующей длины, например, фрагменты могут обрабатываться на геле, таком, как гель агарозы, и фрагменты приблизительно желаемой длины могут отрезаться.

Способ определения последовательности молекулы нуклеиновой кислоты можно также пояснить на примере, используя следующие условия. Вначале произвольно фрагментируется некоторое количество нуклеиновой кислоты, последовательность которой нужно образовать для получения смеси фрагментов нуклеиновой кислоты длиной T. Приготовляется ряд связанных проб олигонуклеотидов с известными последовательностями и длиной F и набор меченых проб олигонуклеотидов в растворе с известными последовательностями и длиной P, где F + P = T, предпочтительно когда T приблизительно равно 3F.

Затем ряд связанных проб олигонуклеотидов приводится в контакт со смесью фрагментов нуклеиновой кислоты в условиях гибридизации, эффективных для того, чтобы позволить формирование первичных комплексов с гибридизированными, дополняющими последовательностями длиной F и негибридизированными последовательностями фрагментов длиной T-F. Предпочтительно гидридизированные последовательности длиной F будут содержать только полностью дополняющие последовательности.

Затем первичные комплексы приводятся в контакт с набором меченых проб олигонуклеотидов в условиях гибридизации, эффективных для того, чтобы позволить образование вторичных комплексов с гибридизированными, дополняющими последовательностями длиной F и соседними гибридизированными, дополняющими последовательностями длиной P. В предпочтительных примерах осуществления изобретения только меченым пробам с полностью дополняющими последовательностями будет позволено гибридизировать, и только тем пробам, которые гибридизируют непосредственно рядом со связанной пробой, будет позволено оставаться гибридизированными. В самых предпочтительных примерах на этом этапе соседние связанные и меченые пробы олигонуклеотидов будут также образовывать связи.

Затем обнаруживаются вторичные комплексы путем обнаружения наличия метки и идентифицируются последовательности длиной F+P из фрагментов нуклеиновой кислоты во вторичных комплексах путем комбинирования известных последовательностей гибридизированных связанных и меченых проб. Затем перекрывающиеся протяженности последовательностей длины F+P будут идентифицироваться, что позволяет реконструировать или собирать полную последовательность нуклеиновой кислоты из определенных перекрывающихся последовательностей.

В способах согласно этому изобретению олигонуклеотиды первого набора могут прикрепляться к твердой основе, т.е. связываться (нейтрализовываться) любым из методов, известных специалистам. Например, прикрепление может производиться посредством адресуемой приводимой в действие лазером фотодепротекции (Фодор и др., 1991; Пиз и др., 1994). Один в общем случае предпочтительный способ - это прикрепление олиго через фосфатную группу с использованием таких реагентов, как нуклеозид фосфорамидит или нуклеозид водород фосфорат, как описано Сазерном и Маскосом (заявки PCT WO 90/03382) с использованием основ из стекла, нейлона или тефлона.

Другой предпочтительный способ - это метод генерированного светом синтеза, описанный Пизом и др. (1994). Можно также купить связанные с основой ряды олигонуклеотидов, например, такие, которые продаются фирмами Affymetrix и Beckman.

Связанные олигонуклеотиды могут образовываться в ряд, содержащий все пробы или подмножества проб с данной длиной (предпочтительно приблизительно 4 - 10 баз), и более предпочтительно во множество рядов связанных олигонуклеотидов, расположенных с образованием так называемого "чипа создания последовательности". Один пример чипа - это когда гидрофобные сегменты используются для создания отдельных пространственных участков. Чипы создания последовательности можно сконструировать для разных областей применения, таких, как планирование, частичное создание последовательности, создание последовательности намеченных участков для целей диагностики, создание последовательности mPHK и создание широкомасштабной последовательности генома. Для каждой области применения можно сконструировать конкретный чип с пробами разных размеров или с неполным набором проб.

В одном примере осуществления изобретения обоими наборами проб олигонуклеотидов будут пробы длиной в 6 баз, т.е. 6-меры. В этом случае каждый набор олиго содержит 4096 отдельных проб. Пробы первого набора предпочтительно фиксированы в ряду на микрочипе, наиболее удобно при размещении в 64 ряда и 64 столбца. Второй набор из 4096 олиго будет метиться обнаруживаемой меткой и распределяться на набор отдельных трубочек. В этом примере 4096 чипов будут комбинироваться в большой ряд или в несколько рядов. После гибридизации фрагментов нуклеиновой кислоты небольшое количество меченых олигонуклеотидов будет добавляться к каждому микрочипу для второго этапа гибридизации и только один из каждых 4096 нуклеотидов будет добавляться к каждому микрочипу.

К числу других объектов этого изобретения относятся наборы материалов для создания последовательностей нуклеотидных кислот. В основном такие наборы включают в себя твердую основу, к которой прикреплен ряд проб олигонуклеотидов с известными последовательностями, как показано на фиг. 2A, фиг. 2B и фиг. 2C, где олигонуклеотиды способны участвовать в реакциях гибридизации, и набор емкостей, содержащих растворы меченых проб олигонуклеотидов с известными последовательностями. Рассматриваются также такие схемы, как те, которые представлены на фиг. 4. Она описывает использование "универсальной базы" либо как способа прикрепления или у конечного положения, чтобы придать новое измерение гибридизации фрагментов.

В этих наборах материалов прикрепленные пробы олигонуклеотидов и пробы в растворе могут иметь длину приблизительно 4-9 бп, причем предпочтительны пробы длиной около 6 бп. Олиго могут быть мечены химически обнаруживаемыми или радиоактивными метками, причем в общем случае предпочтительны пробы, меченые 32P, и еще более предпочтительны пробы, меченые 33P. Наборы материалов могут также включать в себя химическое или другое связующее вещество, такое, как фермент лигазы ДНК. В состав наборов материалов могут включаться разные другие соединения и материалы, такие, как устройства с 96 кончиками или 96 штырьками, буферы, реагенты для разрезания длинных молекул нуклеиновой кислоты и инструменты для выбора размеров фрагментов ДНК. Наборы материалов могут также включать меченые приборы РНК, так что пробы можно удалять обработкой РНКазы и повторно используемыми чипами создания последовательности.

На чертежах проиллюстрировано настоящее изобретение.

На фиг. 1 показаны основные этапы процесса гибридизации. Этап 1: Немеченная целевая ДНК, последовательность которой нужно образовать (Т), гибридизируется в избирательных условиях к ряду прикрепленных проб олигонуклеотидов. Описаны места с пробой Fx и Fy. Дополняющие последовательности для Fx и Fy находятся на разных положениях Т. Этап 2: Меченые пробы Pi (одна проба на чип) гибридизируются к ряду. Описана проба, имеющая дополняющую цель на Т, которая соседствует с Fx, но не с Fy. Этап 3: Путем применения избирательных условий или реагентов селективно расплавляются комплексы без соседних проб. Конкретный пример - это образование связи меченой пробы с фиксированной пробой, когда меченая проба гибридизирует "задней стороной к задней стороне" с прикрепленной пробой. Положительные сигналы обнаруживаются только в случае соседних проб, таких, как Fx и Pi, и в конкретном примере только в случае образовавших связи проб.

На фиг. 2A, фиг. 2B и фиг. 2C представлены компоненты примерного набора материалов для образования последовательностей.

Фиг. 2A. Чипы создания последовательности, представляющие собой ряд 4P тождественных секций, каждая из которых содержит тождественные (или разные) ряды олигонуклеотидов. Секции могут разделяться физическими барьерами или гидрофобными полосками. Считается, что в ряду имеется 4000-16000 олигочипов.

Фиг. 2B - это вид в увеличении секции чипа, содержащей 4F участков, каждый с конкретной пробой олигонуклеотида (4000-16000), синтезированной или установленной в этом месте. Участки могут быть размером всего в несколько микрон, а размер секции приблизительно 1 - 10 мм.

Фиг. 2C представляет набор трубочек или одну или несколько пластин с множеством карманов с соответствующим числом карманов (в этом случае 4P карманов). Каждый карман содержит некоторое количество конкретно меченого олигонуклеотида.

Дополнительное количество проб можно хранить немеченными, если мечение не производится во время синтеза; в этом случае набор материалов для создания последовательности будет содержать необходимые компоненты для мечения проб. Линии, соединяющие трубочки/карманы с секциями чипа, описывают этап в процедуре организации последовательности, когда некоторое количество меченой пробы переносится в секцию чипа. Перенос может осуществляться пипеткой (простой или многоканальной) или рядом штырьков (шпилек), переносящих жидкость посредством поверхностного натяжения. Инструменты для переноса также могут включаться в набор материалов.

Фиг. 3A, фиг. 3B и фиг. 3C. Гибридизация фрагментов ДНК, полученных произвольным разрезанием некоторого количества молекулы ДНК. На фиг. 3A фрагмент T1 ДНК такой, что содержит полные цели для фиксированных и нефиксированных меченых проб. Фиг. 3B представляет случай, когда фрагмент Т ДНК неправильно разрезан. На фиг. 3C имеется достаточно места для гибридизации пробы P, но соседняя последовательность не комплементарна ей. И в случае B, и в случае C сигнал будет уменьшен из-за насыщения молекул прикрепленной пробы F. Одновременная гибридизация фрагментами ДНК и мечеными пробами и циклическое проведение процесса гибридизации - это некоторые возможные способы увеличения выхода правильных соседних гибридизаций.

Фиг. 4. Использование "универсальной базы" как средства связи или в конечном положении для гибридизации. Универсальные базы (М-база, Николс и др. , 1994) или все 4 базы можно добавлять в синтезе пробы. Это один из способов увеличения длины проб и, таким образом, стабильности дуплексов без увеличения количества проб. Кроме того, использование универсальных баз на свободном конце проб создает прокладку, которая позволяет прочитывать последовательность в другом кадре (фрейме).

Определение последовательностей молекул нуклеиновых кислот находит важное использование во всех областях фундаментальных и прикладных биологических исследований (Дрманач и Черквеняков, 1990). Настоящее изобретение создает новые и эффективные способы для создания последовательностей и анализа нуклеиновой кислоты. Одно из намечаемых использований этой методологии в сочетании с другими способами образования последовательностей - это использование в работе над Проектом генома человека (ПГЧ).

В настоящее время известны два метода создания последовательности гибридизации (СПГ). В первом, формат 1, неизвестные геномные ДНК или олигонуклеотиды длиной до 100-200 выстраиваются на твердой подложке. Затем эти ДНК "опрашиваются" гибридизацией набором меченых проб, которые обычно 6-8-меры. В обратном методе, формат 2, олигомеры в 6-8 нуклеотидов связываются (нейтрализуются) на твердой основе, и им позволяют отжигаться до частей клонированной и меченой ДНК.

В любом из двух видов анализа СПГ нужно включать много этапов, чтобы прийти к определенной последовательности. Конкретные проблемы, связанные с существующими методами СПГ, это те, которые ассоциируются с синтезом большого числа проб и с трудностями эффективной избирательной гибридизации. Полное распознавание совпадения-несовпадения затруднено по двум основным причинам. Во-первых, конечное несовпадение проб длиннее, чем 10 баз очень неизбирательно, и, во-вторых, сложная смесь меченных сегментов ДНК, которая получается при анализе длинных фрагментов ДНК, генерирует высокий фон.

Настоящее изобретение обеспечивает эффективную избирательную гибридизацию без большого числа проб или проб с увеличенной длиной и также исключает многие из этапов нанесения меток и клонирования, которые являются конкретными недостатками каждого из известных методов СПГ. Описываемые в высшей степени эффективные способы создания последовательности нуклеиновой кислоты, называемые созданием последовательности в формате 3, основаны на гибридизации с двумя наборами небольших проб олигонуклеотидов с известными последовательностями, и таким образом можно определять, как минимум, в два раза большую длину последовательности. Эти способы позволяют организовывать последовательность чрезвычайно больших молекул нуклеиновой кислоты, включая хромосомы, и решать разные другие проблемы СПГ, такие, как, например, прикрепление или мечение многих фрагментов нуклеиновой кислоты. Изобретение имеет чрезвычайно большую потенцию, т.к. его можно также использовать для создания последовательности РНК и даже неувеличенных образцов РНК.

После настоящего изобретения, как описано в заявке США 08/127.402 и у Дрманача (1994), был представлен другой вариант СПГ, названный позиционным СПГ (ПСПГ) (Бруд и др., 1994). ПСПГ по сути является вариантом СПГ формата 2 (в котором олигонуклеотиды известных последовательностей связываются (нейтрализуются) и используются для гибридизации к нуклеиновым кислотам неизвестной последовательности, которые предварительно метились). В ПСПГ связанные пробы, не будучи простыми, односкрученными пробами, это дуплексы, содержащие односкрученные 3' свесы. Биотинилированные дуплексные пробы связываются на покрытых стрептавидином магнитных шариках с образованием некоторого вида связанной пробы и затем перемешиваются с 32P-мечеными целевыми нуклеиновыми кислотами, последовательность которых нужно создать. Затем добавляется лигаза Т; ДНК для связывания любой гибридизированной целевой ДНК к более короткому концу дуплексной пробы.

Однако, хотя это представляет собой интересный подход, ПСПГ (как оно излагается Брудом и др., 1994) не отражает значительного улучшения по сравнению с существующей технологией СПГ. Например, в отличие от методологии формата 3 этого изобретения, ПСПГ не удлиняет длины последовательности, которую можно определить за один цикл способа. В ПСПГ также поддерживается обременительное требование нанесения меток на неизвестную целевую ДНК, чего не требуется в формате 3. В общем ПСПГ предлагается для использования в сравнительных исследованиях или в планировании, а не в новом создании последовательности генома. Таким образом, это значительно отличается от формата 3, который, хотя и широкого применим во всех областях создания последовательностей, является очень мощным инструментом для образования последовательностей даже самых крупных геномов.

Нуклеиновые кислоты, последовательность которых нужно организовать, можно сначала разделить на фрагменты. Этого можно достигнуть любыми способами, включая, например, разрезание ограничительным ферментным вывариванием, особенно с Cvi JI, как описано Фицджералдом и др. (1992); сдвигом физическими средствами, такими, как ультразвуковая обработка; обработкой NaOH и т.п. При желании фрагменты соответствующей длины, например, приблизительно 10 - 40 бп, могут вырезаться из геля. Полная последовательность нуклеиновой кислоты первоначальной молекулы, такой, как хромосома человека, будет определяться путем определения последовательностей F+P, присутствующих в начальной молекуле, и сборки частей перекрывающихся последовательностей F+P.

Поэтому это не требует промежуточного этапа определения последовательностей фрагмента, скорее последовательность всей молекулы сконструируется из оконтуренных последовательностей F+P.

Для цели следующего обсуждения в общем случае будет приниматься, что 4 базы составляют последовательности нуклеиновых кислот, которые нужно организовать. Это A, G, C и T для ДНК и A, G, C и U для РНК. Однако может быть полезным в некоторых примерах осуществления использовать модифицированные базы в небольших пробах олигонуклеотидов. Чтобы выполнить это изобретение, сначала обычно готовится ряд небольших проб олигонуклеотидов определенной длины, который включает в себя все комбинации последовательностей для этой длины пробы. Это число представляет 4N (4 в степени N), где длина пробы обозначена N. Например, имеются 4096 возможных последовательностей для 6-мерной пробы (46 = 4096).

Один набор таких проб длиной F (4F) будет фиксироваться в квадратном расположении на микрочипе, который может быть в диапазоне от 1 мм2 до 1 см2. В настоящем примере они будут расположены в 64 ряда и 64 столбца. Естественно, обеспечивается, чтобы пробы олиго были прикреплены или иначе связаны с поверхностью микрочипа так, чтобы могли участвовать в реакциях гибридизации. Другой набор олиго с длиной P, числом 4P, будет тоже синтезирован. Олиго в этом наборе "P" будут метиться обнаруживаемой меткой и будут распределяться по набору трубочек (фиг. 2A, фиг. 2B и фиг. 2C).

4P из чипов будут комбинироваться в большой ряд (или несколько рядов приблизительно 10 - 100 см2 для удобных размеров), где P соответствует длине олигонуклеотидов во втором наборе олигомера (фиг. 2B и фиг. 2C). Снова, в качестве удобного примера, P выбирается как 6 (P = 6).

Нуклеиновые кислоты, последовательности которых нужно организовать, будут разделяться на фрагменты с получением меньших фрагментов нуклеиновых кислот с неизвестной последовательностью. Средняя длина этих фрагментов, называемая Т, обычно должна быть больше, чем объединенная длина F и P^ и может быть приблизительно в три раза больше длины F (т.е. F+P T и T приблизительно равно 3F). В настоящем примере целью будет получение фрагментов нуклеиновой кислоты длиной приблизительно 20 базовых пар. Эти фрагменты будут денатурированными и добавляться к большим рядам в условиях, которые облегчают гибридизацию дополняющих последовательностей.

В самой простой и предпочтительной в настоящее время форме изобретения будут выбираться условия гибридизации, которые позволят произойти значительной гибридизации только если 6 последовательных нуклеотидов в фрагменте нуклеиновой кислоты являются дополняющими для всех 6 нуклеотидов F пробы олигонулеотида. Такие условия гибридизации будут определяться обычными начальными исследованиями оптимизации, в которых определяются такие условия, как температура, концентрация разных компонентов, длительность этапов и используемые буферы, включая pH буфера.

На этой стадии каждый микрочип содержит определенные гибридизированные комплексы. Они будут в виде пробы: комплексы фрагмента, в которых вся последовательность пробы гибридизирована к фрагменту, но в которых фрагмент, будучи более длинным, имеет некоторые негибридизированные последовательности, образующие "хвост" или "хвосты" комплекса. В этом примере дополняющие гибридизированные последовательности будут длиной F, а негибридизированные последовательности будут иметь общую длину T-F.

Дополняющая часть фрагмента может располагаться у соответствующего конца или по направлению к нему, так что можно образовать один более длинный негибридизированный хвост. В качестве альтернативы дополняющая часть фрагмента может располагаться по направлению к противоположному концу, так что образуются два негибридизированных хвоста (фиг. 3A, фиг. 3B и фиг. 3C).

После промывки с целью удаления недополняющих фрагментов нуклеиновой кислоты, которые не гибридизировали, небольшое количество меченых олигонуклеотидов в наборе P добавляется к каждому микрочипу для гибридизации к хвостам фрагмента нуклеиновой кислоты неизвестной последовательности, которые выдаются из пробы: комплексы фрагмента. Только один из каждого из 4 нуклеотидов будет добавляться к каждому микрочипу. Сейчас предпочтительно использовать условия гибридизации, которые позволяют иметь место значительному образованию связей только, если все 6 нуклеотидов меченой пробы являются дополняющими для 6 последовательных нуклеотидов хвоста фрагмента нуклеиновой кислоты. Условия гибридизации определяются описанными выше начальными исследованиями, в которых оптимизируются такие элементы, как температура, концентрация, время, буферы и т.п.

На этом этапе каждый микрочип будет содержать определенные "вторичные гибридизированные комплексы". Они будут в форме проба : фрагмент : комплексы пробы, в которой вся последовательность каждой пробы гибридизирована к фрагменту и в которой фрагмент, вероятно, имеет некоторые негибридизированные последовательности. В этих вторичных гибридизированных комплексах связанная проба и меченая проба могут быть гибридизированы к фрагменту, так что две пробы являются непосредственно соседними или расположены друг к другу задними сторонами.

Однако, учитывая то, что фрагменты будут в общем случае более длинными, чем сумма длин проб, связанная проба и меченая проба могут гибридизировать к фрагменту в не соседних положениях, отделенных одной или несколькими базами.

Затем большие ряды обрабатываются посредством процесса для удаления негибридизированных меченых проб. В предпочтительных примерах осуществления используемый процесс удалит из ряда не только негибридизированные меченые пробы, но и не соседние гибридизированные меченые пробы. В процессе используются избирательные условия, чтобы позволить этим вторичным комплексам гибридизации, которые содержат соседние связанные и меченые пробы, дискриминироваться из тех вторичных комплексов гибридизации, в которых фрагмент нуклеиновой кислоты гибридизирован к 2-м пробам, но эти пробы не соседние. Это является важным аспектом изобретения в том смысле, что это позволит конечное оконтуривание секции последовательности фрагмента, соответствующей комбинированной последовательности связанной пробы и меченой пробы.

Процесс избирательности, используемый для удаления негибридизируемых и не соседних гибридизированных проб из ряда при оставлении соседних гибридизированных проб прикрепленными может быть снова контролируемым процессом промывки. Соседние гибридизированные пробы не будут подвергаться влиянию выбранных условий из-за своей повышенной стабильности благодаря реакциям между наборами (слоями) соседних нуклеотидов. Однако в предпочтительных примерах осуществления будут обрабатываться крупные ряды, так что любые соседние пробы будут ковалентно связаны, например, путем обработки раствором, содержащим химическое связующее вещество или, более предпочтительно, фермент лигазы, такой как лигаза T4 ДНК (Ландегрен и др., 1988; Ву и Уоллас, 1989).

В любом случае полный ряд будет подвергаться строгому промыванию, так что единственная оставшаяся метка, связанная с рядом, будет в виде двойных скрученных комплексов проба-фрагмент-проба с соседними гибридизированными частями с длиной F+P (т.е. 12 нуклеотидов в данном примере). С использованием этой двухэтапной реакции гибридизации возможна очень высокая избирательность, потому что в расчет принимаются 3 или 4 независимых избирательных процесса: избирательная гибридизация фрагмента T к пробе длиной F баз; избирательная гибридизация пробы длиной P баз к фрагменту T; избирательная стабильность полного совпадения (F+T+P) гибрида по сравнению с P гибридами или даже с несовпадающими гибридами, содержащими не соседствующие пробы F+P; и избирательное образование связей 2-х конечных баз F и P.

Затем обнаруживаются так называемые соседние вторичные комплексы путем наблюдения местоположения остающейся метки на ряде. С положения метки можно определить последовательность длиной F+P (например, 12) нуклеотидов путем комбинирования известных последовательностей связанных (нейтрализованных) и меченых проб. Затем можно реконструировать или собрать полную последовательность нуклеиновой кислоты первоначальной молекулы, такой, как хромосома человека, из определенных таким образом перекрывающихся последовательностей F+P.

Если образование связей используется в процессе создания последовательности, как сейчас предпочтительно, то обычный чип олигонуклеотидов нельзя использовать повторно. Изобретатель считает, что это не будет ограничивать, т.к. имеются разные методы утилизации. Например, можно сформировать специфически легко расщепляющуюся связь между пробами и затем расщепить связь после обнаружения.

В качестве альтернативы можно использовать рибонуклеотиды для второй пробы, пробы P, или использовать рибонуклеотид для соединения базы в пробе P, так что эту пробу можно затем удалить обработкой РНКазой или урацил-ДНК гликосилатом (Крейг и др. , 1989). Другие рассматриваемые способы должны установить связи путем химического образования связей, которые можно селективно обрубить (Долинная и др., 1988).

Другие варианты и улучшения этой методологии создания последовательности также рассматриваются и входят в рамки этого изобретения. Сюда относится использование модифицированных олигонуклеотидов для повышения специфичности или эффективности способов, аналогичное описанному Хохайзелем и Лерахом (1990). Можно применять и гибридизации с проведением циклов для увеличения сигнала гибридизации, как это используется в технологии PRC. В этих случаях будут использоваться циклы с разными температурами для повторения гибридизации некоторых проб. Изобретение предусматривает также определение сдвигов в кадрах считывания с использованием равномолярных количеств проб, которые имеют разную базу у концевого положения. Например, используя равномолярные 7-меры, в которых первые 6 баз это та же самая определенная последовательность, а последние положения могут быть A, T, C или G в альтернативе.

Включаются следующие примеры для демонстрации предпочтительных примеров осуществления изобретения. Специалисты должны понимать, что описываемые в следующих примерах методы представляют собой методы, открытые изобретателем для нормального функционирования при практическом использовании изобретения, и таким образом их можно считать составляющими предпочтительные режимы такого практического использования.

Однако специалисты должны понять в свете этого описания, что можно сделать много изменений в конкретных примерах осуществления, которые здесь описаны, и все же получить похожий или аналогичный результат, не отходя от духа и объема изобретения.

Пример I Приготовление связанных с основой олигонуклеотидов Олигонуклеотиды, т.е. небольшие сегменты нуклеиновой кислоты, можно легко приготовить, например, путем прямого синтеза олигонуклеотида химическими средствами, как обычно происходит на практике с использованием автоматизированного синтезатора олигонуклеотидов.

Связанные с основой нуклеотиды могут готовиться любым из способов, известным специалистам, с использованием любой пригодной основы, такой, как стекло, полистирен или тефлон. Одна стратегия состоит в точном нахождении места олигонуклеотидов, синтезированных стандартными синтезаторами. Связывание (нейтрализацию) можно достичь пассивной адсорбцией (Инуйе и Хондо, 1990); использованием УФ-света (Нагата и др., 1985; Дален и др., 1987; Морри и Коллинс, 1989) или образованием ковалентной связи базовой модифицированной ДНК (Келлер и др., 1988; 1989).

Можно применять другую стратегию - использовать в качестве образователя связи сильное взаимодействие биотин-стрептавидин. Например, Бруд и др. (1994) описывают использование биотинилированных проб, хотя это дуплексные пробы, которые связаны на покрытых стрептавидином магнитных шариках. Покрытые стрептавидином шарики можно купить в фирме Dynal, Осло. Конечно, эта же химия образования связей применима к покрытию любой поверхности стрептавидином. Биотинилированные пробы можно купить в разных фирмах, например, в Operon Technologies (Аламеда, Калифорния).

Фирма Nunc Laboratories (Нейпервилл, Иллинойс) также продает подходящий к использованию материал. Nunc Laboratories разработала метод, посредством которого ДНК можно ковалентно связать с поверхностью с микрокарманами, называемой CovaLink NH. CovaLink NH - это поверхность из полистирена, к которой привиты вторичные амино-группы (> NH), которые служат предмостными позициями для образования дальнейших ковалентных связей. Модули CovaLink можно закупить в Nunc Laboratories. Молекулы ДНК могут быть связаны с CovaLink исключительно у 5'-конца посредством связи фосфорамидата, что позволяет связывание (нейтрализацию) более чем 1 пмоля ДНК (Расмуссен и др., 1991).

Использование полосок CovaLink NH для ковалентного связывания молекул ДНК у 5'-конца было описано (Расмуссен и др., 1991). В этой технологии используется связь фосфорамидата (Чу и др. , 1983). Это полезно, так как предпочтительно связывание (нейтрализация) с использованием только одной ковалентной связи. Связь фосфорамидата связывает ДНК со вторичными амино-группами CovaLink NH, которые расположены у конца плеч прокладки, ковалентно привитых на поверхность полистирена через плечо прокладки длиной 2 нм.

Чтобы связать олигонуклеотид с CovaLink NH через связь фосфорамидата, окончание олигонуклеотида должно иметь 5'-конец фосфатную группу. Вероятно, даже можно ковалентно связать биотин с CovaLink и затем использовать стрептавидин для связывания проб.

Более конкретно, способ образования связи включает в себя растворение ДНК в виде (7,5 нг/мкл) и денатурирование в течение 10 мин при 95oC и охлаждение на льду в течение 10 мин 0,1 М 1-метилимидазол с температурой льда, pH 7,0 (1-MeIm7) затем добавляется к конечной концентрации 10 mM 1-MeIm7. Затем раствор ss ДНК наносится на полоски CovaLink (75 мкл/карман), стоящие на льду.

Карбодиимид 0,2 М 1-этил-3-(3-диметиламинопропил)-карбодиимид (EDC), растворенный в 10 mM 1-MeIm7, освежается и 25 мкл добавляется на карман. Полоски выдерживаются в термостате 5 часов при 50oC. После выдержки полоски промываются с использованием, например, Nunc-Immuno Wash; сначала полоски промываются 3 раза, затем они промакиваются промывающим раствором в течение 5 мин и наконец они промываются 3 раза (причем промывающий раствор это 0,4 N NaOH, 0,25% SDS, нагретого до 50oC).

Считается, что еще один пригодный метод для использования с этим изобретением описан в заявке WO 90/03382 (Сазерн и Маскос). Этот способ приготовления олигонуклеотида, связанного с основой, предполагает прикрепление нуклеозида 3'-реагента через фосфатную группу ковалентной связью сложного двойного эфира фосфора к алифатическим гидроксильным группам, несомым основой. Затем олигонуклеотид синтезируется на поддерживаемом нуклеозиде и защищающие группы удаляются из цепочки синтетического олигонуклеотида в стандартных условиях, которые не отщепляют олигонуклеотида от основы. К числу пригодных реагентов относятся нуклеозид фосфорамидит и нуклеозид водород фосфорат.

Более конкретно, чтобы использовать этот метод, основа, например стеклянная пластина, дериватизируется при контакте со смесью ксилена, глицидоксипропилтриметоксилана и малым количеством диизопропилэтиламина при 90oC в течение полусуток. Затем она тщательно промывается метанолом, эфиром и высушивается на воздухе. Затем дериватизированная основа нагревается перемешиванием в гексаэтиленгликоле, содержащем каталитическое количество концентрированной серной кислоты, в течение полусуток в атмосфере аргона при 80oC с получением алкил гидроксил дериватизированной основы. После промывания метанолом и эфиром основа высушивается в вакууме и хранится в аргоне при -20oC.

Затем синтез олигонуклеотида производится вручную в стандартных условиях с использованием дериватизированной стеклянной пластинки в качестве твердой основы. Первый нуклеотид будет 3'-водород фосфат, используемый в виде соли триэтиламмония. Этот метод приводит к получению связанных с основой олигонуклеотидов высокой чистоты.

Можно применять стратегию "на чипе" для приготовления рядов проб ДНК. Например, адресуемую приводимую в действие лазером фотодепротекцию можно использовать в химическом синтезе олигонуклеотидов прямо на стеклянной поверхности, как описано Фодором и др. (1991). Пробы также можно связать (нейтрализовать) на нейлоновых основах, как описано Ван Нессом и др. (1991); или связать с тефлоном с использованием метода Данкена и Кавальера (1988).

Фодор и др. (1991) описывают направляемый светом синтез динуклеотидов, который применим к пространственно направленному синтезу сложных соединений для применения в микропроизводстве устройств. Он основан на методе, использующем свет для направления одновременного синтеза химических соединений на твердой основе. Структура воздействия света или других видов энергии через маску или другими пространственно адресуемыми средствами определяет то, какие области основы активизируются для создания химической связи.

Активация светом происходит из удаления фотолабильных защищающих групп из выбранных участков. После депротекции (снятия защиты) первое соединение, содержащее фотолабильную защищающую группу, подвергается воздействию по всей поверхности, однако реакция происходит только с участками, на которые попал свет на предыдущем этапе. Затем подложка освещается через вторую маску, которая активизирует другую область для реакции со вторым защищенным стандартным блоком. Структура масок, используемых в таком освещении, и последовательность реагентов определяют конечные продукты и их размещение. При методе Фодора возможна высокая степень миниатюризации, потому что плотность мест синтеза связана только физическими ограничениями на пространственную адресуемость, т.е. дифракцией света. Каждое соединение доступно и его положение точно известно. Поэтому олиго-чип, получаемый таким образом, можно легко использовать в СПГ.

Фодор и др. (1991) описывают активизированное светом образование динуклеотида следующим образом. 5'-Нитровератрил тимидин синтезировался из 3'-О-тимидин ацетата. После депротекции с базой 5'-нитровератрил тимидин прикреплялся к аминированной подложке через связь с 3'-гидроксильной группой. Защищающие группы нитровертрила удалялись освещением через 500 мкм маску типа шахматной доски. Затем подложка обрабатывалась активизированным фосфорамидитом 2'-деоксицитидином. Чтобы отслеживать реакцию флуорометрически, деоксицитидин модифицировался образователем связи, защищенным FMOC аминогексилом, прикрепленным к эксоциклическому амину. После удаления FMOC-защищающей группы с базой области, которые содержали динуклеотид, были флюоресцентно мечены обработкой подложки FITC. Поэтому, следуя этому методу, можно синтезировать связанные с основой олигонуклетиды.

Образование связи олигонуклеотида с нейлоновой основой, как описано Ван Нессом и др. (1991), требует активации нейлоновой поверхности через алкилацию и селективную активацию 5'-амина олигонуклеотидов цианур-хлоридом следующим образом. Нейлоновая поверхность этилируется с использованием триэтилоксоний тетрафторобората с образованием амин-реактивных имидат-сложных эфиров на поверхности нейлона и 1-метил-2-пирролидон используется как растворитель. Поверхность нейлона не полируется, чтобы была максимально возможная площадь поверхности.

Затем активизированная поверхность реагирует с поли(этиленимин) (Mr приблизительно 10K-70K) с образованием полимерного покрытия, которое создает расширенную поверхность амина для прикрепления олиго. Олигонуклеотид(ы) с аминным хвостом селективно реагирует с избытком цианур-хлорида, исключительно в аминном хвосте, давая 4,6-дихлоро-1,3,5-триазинил-олигонуклеотид(ы) в количественном выходе. Смещение одной хлорной среды цианур-хлорида амино-группой значительно уменьшает реактивность остающихся групп хлора. Это приводит к повышенной гидролитической стабильности 4,6-дихлоро-1,3,5-триазинил-олигонуклеотида (олигонуклеотидов), который стабилен значительные периоды времени в содержащих буфер водных растворах (pH 8,3, 4oC, 1 неделя) и легко изолируется и очищается хроматографией размерного элюирования или ультрафильтрацией.

Эта реакция специфична для аминного хвоста без очевидной реакции на нуклеотидных средах. Затем покрытая PEI поверхность нейлона реагирует с активизированным цианур-хлоридом олигонуклеотидом. Высокие концентрации "захватывающей" последовательности легко связываются на поверхности и непрореагировавшие амины покрываются сукциновым ангидридом на конечном этапе процесса дериватизации.

Один конкретный способ приготовления олигонуклеотидов, связанных с основой, заключается в использовании генерируемого светом синтеза, описанного Пизом и др. (1994). Эти авторы использовали существующие методы фотолитографии для формирования рядов связанных проб олигонуклеотидов (чипов ДНК). Эти методы, в которых свет используется, чтобы направлять синтез проб олигонуклеотидов в миниатюризованных рядах высокой плотности, используют фотолабильные 5'-защищенные N-ацил-деокси нуклеозид фосфорамидиты, химию поверхностного создателя связей и универсальные стратегии комбинаторного синтеза. Матрица их 256 пространственно определенных проб олигонуклеотидов может формироваться таким образом и затем использоваться в удобной организации последовательности в формате 3, как здесь описано.

Пиз и др. (1994) представили стратегию, пригодную для использования в направляемом светом синтезе олигонуклеотидов. В этом способе поверхность твердой опоры, модифицированная фотолабильными защищающими группами, освещается через фотолитографическую маску, давая реактивные гидоксильные группы в освещенных участках. Затем 3'O-фосфорамидит-активизированный деоксинуклеозид (защищенный как 5'-гидроксил фотолабильной группой) подается на поверхность и связи образуются на местах, на которые воздействовал свет. Вслед за покрытием окислением подожка промывается и поверхность освещается через 2-ю маску для воздействия на дополнительные гидроксильные группы для образования связей. Второй 5'-защищенный, 3'O-фосфорамидит-активизированный деоксинуклеозид наносится на поверхность. Селективная фотодепротекция и циклы образования связей повторяются пока не получается желаемый выбор продуктов. Поскольку применяется фотолитография, процесс можно миниатюризовать для формирования рядов с высокой плотностью проб олигонуклеотидов, последовательность которых известна в каждом месте.

Путь синтеза для приготовления необходимых 5'O-(альфа-метил-6-нитропиперонилоксикарбонил)-N-fwbk -2'-деоксинуклеозид фосфорамидитов (MeNPoc-N-ацил- 2'-деоксинуклеозид фосфорамидитов) предполагает на первом этапе наличие N-ацил-2'-деоксинуклеозида, который реагирует с 1-(2-нитро-4,5-метилендиоксифенил)-этил-1-хлороформатом с получением 5'-MeNPoc-N-ацил-2'-деоксинуклеозида. На втором этапе 3'-гидроксил реагирует с 2-цианоэтил N,N'-диизопропилхлорофосфорамидитом с использованием стандартных процедур с получением 5'-MeNPoc-N-ацил-2'-деоксинуклеозид-3'-O-(2-цианоэтил-N-N- диизопропил)фосфорамидитов. Светозащищающая группа стабильна в обычных условиях синтеза фосфорамидита и может удаляться водной базой. Эти реагенты можно длительно хранить в аргоне при 4SOOC.

Сообщалось о периодах полупроведения фотолиза 28 с, 31 с, 27 с и 18 с для MeNPoc-dT, MeNPoc-dcibu, MeNPoc-dGPAC и MeNPoc-dAPAC соответственно (Пиз и др., 1994). Поэтому в литографическом синтезе рекомендуется время освещения 4,5 мин (9 t1/2MeNPoc-dC) для обеспечения > 99% удаления MeNPoc защищающих групп.

Пригодная синтетическая основа состоит из 5,1 х 7,6 см стеклянной подложки, приготовленной путем чистки в концентрированной NaOH, за чем следует исчерпывающее полоскание в воде. Затем поверхности дериватизируются 2 часа раствором 10% (объем/объем) бис(2-гидроксиэтил) аминопропилтриэтоксилана (фирма Petrarch Chemicals, Бристол, Пенсильвания) в 95% этанола, промываются тщательно этанолом и эфиром, высушиваются в вакууме при 40oC и нагреваются при 100oC в течение 15 мин. В таких исследованиях образователь связи синтеза прикрепляется реакцией дериватизированных подложек с 4,4'-диметокситритил (DMT)-гексаэтилокси-O-цианоэтил фосфорамидитом.

Резюмируя, чтобы инициировать синтез пробы олигонуклеотида, подходящая производная деоксинуклеозид фосфорамидита прикрепляется к синтетической основе через образователь связи. Затем области основы активизируются для синтеза освещением через, например, отверстия 800 х 12800 мкм фотолитографической маски. Могут проводиться дополнительные циклы синтеза фосфорамидита (с DMT-защищенными деоксинуклеозидами) для формирования любой требуемой последовательности, такой как любая 4-, 5-, 6-, 7-, 8-, 9- или даже 10-мерная последовательность. После удаления фосфата и экзоциклических амин-защищающих групп концентрированной NH4OH в течение 4 часов подложку можно установить в термостатически контролируемую камеру гибридизации с водяной рубашкой, готовую к работе.

Конечно, можно легко приобрести чип ДНК, такой как один из описанных выше активизируемых светом чипов, из промышленного источника. В этом отношении можно связаться с фирмами Affymetrix из Санта-Клары, Калифорния 95051, и Beckman.

Пример II Модифицированные олигонуклеотиды для использования в пробах
Модифицированные олигонуклеотиды могут использоваться во всех процедурах этого изобретения для повышения специфичности или эффективности гибридизации. Способ достижения этого - замена природных нуклеотидов модификацией базы. Например, можно использовать пиримидины с галогеном у положения C5. Считается, что это улучшает стабильность дуплекса путем влияния на установку базы слоями. Можно также применять 2,6-диаминопурин для придания 3-й связи галогена в его базовом спаривании с тимином, что термически стабилизирует ДНК-дуплексы. Сообщалось, что использование 2,6-диаминопурина приводит к значительному улучшению стабильности дуплекса коротких олигомеров. Его включение, как предлагается, предоставляет более строгие условия отжига инициирующего вещества, тем самым улучшая специфичность образования дуплекса и подавляя фоновые проблемы или исключая использование более коротких олигомеров.

Синтез вариантов трифосфата этих модифицированных нуклеотидов описан Хохайзелем и Лерахом (1990). 5-хлоро-2'-деоксиуридин и 2,6-диаминопурин 2'-деоксинуклеозид приобретаются, например, в фирме Sigma. Фосфорилирование выполняется следующим образом: 50 мг сухого 2-NH2-dAdo принимается в 500 мкл сухого триэтил фосфата при перемешивании в аргоне. Добавляется 25 мкл POCl3 и смесь выдерживается в термостате при -20oC. Тем временем 1 ммоль пирофосфорной кислоты растворяется в 0,95 мл три-n-бутиламина и 2 мл метанола и высушивается во вращающемся испарителе. Затем она высушивается испарением дважды из 5 мл пиридина, причем перед вторым разом также добавляется 70 мкл три-n-бутиламина. Наконец, это растворяется в 2 мл сухого диметил формамида.

Спустя 90 мин при -20oC смесь фосфорилирования испаряется для удаления избытка POCl3 и добавляется три-n-бутиламмоний пирофосфат в диметил формамиде. Выдерживание проводится в течение 1,5 мин при комнатной температуре. Реакция останавливается путем добавления 5 мл 0,2 М триэтиаламмоний бикарбоната (pH 7,6) и смесь держится на льду 4 часа. Для 5-Cl-dUrd условия будут тождественны, но добавляется 50 мкл POCl3 и фосфорилирование проводится при комнатной температуре в течение 4 часов.

После гидролиза смесь испаряется, pH устанавливается на 7,5 и экстрагируется 1 объемом диэтил эфира. Разделение продуктов производится, например, на (2,5 х 20 см) Q-Sepharose колонне с использованием линейного градиента 0,15 М к 0,8 М триэтиламмоний бикарбонату. При хранении замороженными нуклеотиды стабильны длительное время. Можно также использовать неизбирательный аналог базы или универсальную базу, как она сконструирована Николсом и др. (1994). Этот новый аналог, 1-(2'-деокси-бета-D-рибофураносил)-3-нитропиррол (обозначаемый М), был сформирован для использования в пробах олигонуклеотидов и инициирующих веществах для решения проблем проектирования, которые возникают в результате вырождения генетического кода или когда имеются только данные по фрагментарной последовательности пептидов. Этот аналог повышает укладку слоями и одновременно минимизирует взаимодействия с образованием водородных связей, не разрушая пространственно дуплекс ДНК. Аналог М нуклеозида был сконструирован, чтобы максимально увеличить взаимодействия при укладке слоями с использованием апротических полярных заместителей, связанных с гетероароматическими кольцами, повышая внутри- и внепрядевые взаимодействия при укладке, чтобы уменьшить роль водородных связей в специфичности базового спаривания. Николс и др. (1994) предпочитают 3-нитропиррол 2'-деоксирибонуклеозид из-за его структурной и электронной схожести с р-нитроанилином, чьи производные относятся к самым малым известным пропласткам двойной свитой ДНК.

Диметокситритил-защищенный фосфорамидит нуклеозида M также может включаться в нуклеозиды, используемые как инициирующие вещества для образования последовательности и цепной реакции полимеразы (PCR). Николс и др. (1994) показали, что значительное количество нуклеотидов могут заменяться M без потери специфичности инициирующего вещества. Уникальное свойство M - это его способность замещать длинные звенья смежных нуклеозидов и все же давать функциональные инициирующие вещества для образования последовательностей. Как сообщалось, все последовательности с 3, 6 и 9 замещениями M дают читаемые "лестницы" образования последовательностей, и все PRC с 3-мя разными содержащими M инициирующими веществами привели к расширению правильного продукта (Николс и др., 1994).

Способность содержащих 3-нитропиррол олигонуклеотидов функционировать в качестве инициирующих веществ уверенно показывает, что дуплексная структура должна образовываться с дополняющими прядями. Оптические тепловые профили, полученные для пар олигонуклеотидов d(5'-C2-T5XT5G2-3') и d(5'-C2A5YA5G2-3') (где X и Y могут быть A, C, G, T или M), как сообщалось, подходят под обычный сигмоидальный рисунок, наблюдаемый для перехода от двойной к одной пряди (нити) ДНК. Значения Tm олигонуклеотидов, содержащих базовые пары XM (где X было A, C, G или T и Y было M), как сообщалось, все попадают в диапазон 3oC (Николс и др., 1994).

Пример III
Приготовление образующих последовательностей чипов и рядов
Этот пример описывает физические варианты осуществления образующих последовательности чипов, рассматриваемых изобретателем.

Основной пример - это использование 6-меров, прикрепленных к поверхностям в 50 микрон для получения чипа с размерами 3 х 3 мм, который можно комбинировать с получением ряда 20 х 20 см. Другой пример - это использование 9-мерных олигонуклеотидов, прикрепленных к поверхности в 10 х 10 микрон для создания 9-мерного чипа с размерами 5 х 5 мм. 4000 единиц таких чипов можно использовать для создания ряда 30 х 30 см. На фиг. 2A, фиг. 2B и фиг. 2C показан еще один пример ряда, в котором 4000-16000 олигочипов расположены по квадрату. Пластина или набор трубочек, как также указано, можно упаковать с этим рядом как часть набора материалов для создания последовательностей.

Ряды можно отделить физически друг от друга или с помощью гидрофобных поверхностей. Один возможный способ использовать разделение гидрофобной полоской - это применить такую технологию, как Iso-Grid Microbiology System, выпускаемую фирмой QA Laboratories, Торонто, Канада.

Гидрофобные сеточные мембранные фильтры (HGMF) использовались в аналитической микробиологии пищевых продуктов уже около десятилетия, где они уникально привлекательны тем, что имеют расширенный числовой диапазон и автоматизированный подсчет колоний. Одна промышленно поставляемая сетка - это ISO-GRID(TM) от фирмы QA Laboratories Ltd. (Торонто, Канада), которая состоит из квадрата (60 х 60 см) полисульфонного полимера (Gelman Tuffryn HT-450, размер пор 0,45 мю), на котором отпечатана краской черная гидрофобная сетка, состоящая из 1600 (40 х 40) квадратных ячеек. HGMF был предварительно модифицирован добавкой бактериальных суспензий вакуумной фильтрацией и выдерживался на дифференциальной или селективной среде по выбору.

Поскольку рост микробов ограничен ячейками сетки с известным положением и размером мембраны, HGMF функционирует более как аппарат MPN, чем обычная пластина или мембранный фильтр. Петеркин и др. (1987) сообщили, что эти HGMF можно использовать для распространения и хранения геномных библиотек при использовании с репликатором HGMF. Один такой инструмент реплицирует рост от каждой из 1600 ячеек ISO-GRID и позволяет сделать много копий образцового HGMF (Петеркин и др., 1987).

Шарп и др. (1989) также применяли ISO-GRID HGMF от QA Laboratories и автоматизированный счетчик HGMF (MI-100 Interpreter) и репликатор RP-100. Они сообщили о методе поддержания и сортировки многих культур микробов.

Петеркин и его коллеги после описали способ сортировки проб ДНК с использованием гидрофобного сеточно-мембранного фильтра (Петеркин др., 1989).

Эти авторы сообщили о способах эффективной гибридизации колоний прямо на HGMF. Раньше плохие результаты получались из-за низкой связующей ДНК способности полисульфонного полимера, на котором печатаются HGMF. Однако Петеркин и др. (1989) сообщили, что связывание ДНК с поверхностью мембраны улучшилось при обработке реплицированных и выдержанных в термостате HGMF полиэтиленимином, поликатионом, до контакта с ДНК. Хотя в этой ранней работе использовалось ячеистое прикрепление ДНК и цель была отличной от цели этого изобретения, описанную методологию можно легко адаптировать для формата 3 СПГ.

Для того чтобы быстро идентифицировать полезные последовательности, Петеркин и др. (1989) использовали радиомеченную плазмидную ДНК из разных клонов и испытывали ее специфичность относительно ДНК на приготовленных HGMF. Таким образом, ДНК из рекомбинантных плазмидов быстро сортировалась гибридизацией колоний относительно 100 организмов на репликатах HGMF, которые можно легко и воспроизводимо приготовить.

Нужно решить две основные проблемы. Манипулирование с малыми (2-3 мм) чипами и параллельное выполнение тысяч реакций. Решение, которое предлагает это изобретение, состоит в том, чтобы содержать чипы и пробы в соответствующих рядах. В одном примере чипы, содержащие 250000 9-меров синтезируются на кремниевой подложке в форме пластин 8 х 8 mM (15 мкМ/олигонуклеотид, Пиз и др., 1994), выстроенных в формате 8 х 12 (96 чипов) с желобком между ними в 1 mM. Пробы добавляются либо многоканальной пипеткой, либо рядом штырьков, по одной пробе на 1 чип. Для расчета всех 4000 6-меров нужно применять 42 ряда чипов, или используя разные ряды, или повторно используя один набор рядов чипов несколько раз.

В указанном случае при использовании ранней номенклатуры этой заявки, F= 9; P=6; F+P=15.

Чипы могут иметь пробы с формулой BxNn, где x - это число специфицированных баз B; а n - это число неспецифицированных баз, так что x=4-10 и n= 1-4. Чтобы достичь более эффективной гибридизации и избежать потенциального влияния любых олигонуклеотидов основы, специфицированные базы можно окружить неспецифированными базами, что представляется такой формулой как (N)nBx(N)m (фиг. 4).

Пример IV
Приготовление фрагментов нуклеиновой кислоты
Нуклеиновые кислоты, последовательности которых нужно создать, можно получить из любого подходящего источника, такого, как сДНК, геномная ДНК, хромосомная ДНК, микрорассеченные хромосомные полосы, космидные или YAC вставки и РНК, включая mРНК без каких-либо этапов расширения. Например, Сэмбрук и др. (1989) описывают 3 протокола для изолирования ДНК с высоким молекулярным весом от клеток млекопитающих (стр. 9.14-9.23).

Затем нуклеиновые кислоты фрагментируются любым из способов, известных специалистам, включая, например, использование ограничительных ферментов, как описано на стр. 9.24-9.28 у Сэмбрука и др. (1989), сдвиг ультразвуком и обработку NaOH.

Сдвиг при низком давлении также уместен, как описано Шрифером и др. (1990). В этом способе образцы ДНК пропускаются через небольшой французский датчик давления с набором давлений от малого до промежуточного. Рычажное устройство позволяет производить контролируемое приложение от малого до промежуточного давления к элементу. Результаты этих исследований указывают, что сдвиг при малом давлении - это полезная альтернатива звуковых и ферментных методов фрагментации ДНК.

Один особенно подходящий способ для разделения ДНК на фрагменты, как считается, это тот, где используются две эндонуклеазы с распознаванием базы, CviJI, описанный Фицджералдом и др. (1992). Эти авторы описали подход для быстрой фрагментации и фракционирования ДНК на конкретные размеры, которые они считали пригодными для "дробного" клонирования и создания последовательностей. Настоящий изобретатель предусматривает, что это будет также особенно пригодно для генерирования произвольных, но относительно небольших фрагментов ДНК для использования в настоящей технологии образования связей.

Ограничительная эндонуклеаза CviJI обычно расщепляет распознавательную последовательность PnGCPy между G и C с оставлением тупых концов. Нетипичные условия реакции, которые меняют специфичность этого фермента (CviJI**), дают квази-произвольное распределение фрагментов ДНК из малых молекул pUC19 (2688 базовых пар). Фицджералд и др. (1992) количественно оценили произвольность этой стратегии фрагментирования с использованием CviJI** продукта вываривания pUC19, который был фракционирован по размерам способом быстрой гелевой фильтрации и непосредственно связан, без ремонта концов, вектором клонирования lacZ minus M13. Анализ последовательности 76 клонов показал, что CviJI** ограничивает PyGCPy и PuGCPu в дополнение к местам PuGCPy и что новые данные о последовательность накапливаются со скоростью, согласующейся с произвольной фрагментацией.

Как сообщается в литературе, преимущества этого подхода по сравнению с фракционированием соникацией (звуком) и агарозным гелем включают в себя: требуются меньшее количество ДНК (0,2-0,5 мкг вместо 2-5 мкг) и имеется меньше этапов (не нужно предварительного связывания, ремонта концов, химической экстракции или электрофореза агарозного геля и элюирования). Предлагается, что эти преимущества также будут полезны при приготовлении ДНК для создания последовательностей по формату 3.

Независимо от того, как получаются или готовятся фрагменты нуклеиновой кислоты, важно денатурировать ДНК, чтобы получить для гибридизации одно-завитые кусочки. Это достигается выдерживанием раствора ДНК в течение 2-5 минут при 80-90oC. Затем раствор быстро охлаждают до 2oC для предотвращения повторной натурации фрагментов ДНК до того, как они контактируют с чипом. Фосфатные группы тоже нужно удалить из геномной ДНК, как описано в примере VI.

Пример V
Приготовление меченых проб
Пробы олигонуклеотидов можно готовить автоматизированным синтезом, что является рутинным для специалистов, например, с использованием системы Applied Biosystems. В качестве альтернативы пробы можно приготовить, используя методы Biotechnologies Inc. с помощью слоев пористых подложек тефлона.

Пробы олигонуклеотидов можно метить, например, радиоактивными метками (355, 32P, 33P и предпочтительно 33P) для рядов с участками 100-200 мкм или 100-400 мкм; нерадиоактивными изотопами (Якобсен и др., 1990); или флуорофорами (Брамбо и др. , 1988). Все такие способы нанесения меток являются обычными в технике, как показано в соответствующих разделах у Сэмбрука и др. (1989) и в другой литературе, например, у Шуберта и др. (1990), Мураками и др. (1991) и Кейта и др. (1991).

В отношении радиомечения обычные способы - это мечение концов с использованием T4 полинуклеотидной киназы или нанесение меток с высокой специфической активностью с использованием Кленов или даже T7 полимеразы. Это описывается следующим образом.

Синтетические олигонуклеотиды синтезируются без фосфатной группы у своих окончаниях 5' и поэтому легко метятся переносом гамма-32P или гамма-33P из (гамма-32P)ATP или (гамма-33)ATP с использованием фермент бактериофаг T4 полинуклеотид киназы. Если реакция проводится эффективно, специфическая активность таких проб может быть такой высокой, как специфическая активность самих (гамма-32P)ATP или (гамма-33P)ATP. Описанная ниже реакция предназначена метить 10 пмолей олигонуклеотида до высокой специфической активности. Нанесение меток на разные количества олигонуклеотида можно легко достичь путем увеличения или уменьшения размера реакции при поддержании постоянными концентрации всех компонентов.

Реакционная смесь будет создаваться с использованием 1,0 мкл олигонуклеотида (10 пмолей/мкл); 2,0 мкл 10х бактериофаг T4 полинуклеотид киназного буфера; 5,0 мкл (гамма-32P)ATP или (гамма-33P)ATP (пр. акт. 5000 Ci/ммоль; 10 mCi/мл в водном растворе) (10 пмолей); и 11,4 мкл воды. 8 единиц (около 1 мкл) бактериофаг T4 полинуклеотидной киназы добавляется к реакционной смеси, хорошо перемешивается и выдерживается 45 минут при 37oC. Реакционная смесь нагревается в течение 10 минут при 68oC для инактивации бактериофаг T4 полинуклеотидной киназы.

Затем определяется эффективность переноса 32P или 33P к олигонуклеотиду и его специфическая активность. Если специфическая активность пробы приемлема, она очищается. Если специфическая активность слишком низка, добавляются еще 8 единиц фермента и выдерживаются еще 30 минут при 37oC до нагревания реакционной смеси в течение 10 минут при 68oC для инактивации фермента.

Очистка радиомеченных олигонуклеотидов может достигаться путем осаждения с этанолом; осаждением с цетилпиридиний бромидом; хроматографией через биогель P-60; или хроматографией на колонне Sep-Pak C18.

Пробы с более высокими специфическими активностями можно получить, используя фрагмент Кленова E.coli ДНК полимеразы I для синтезирования пряди ДНК дополняюще к синтетическому олигонуклеотиду. Короткое инициирующее вещество гибридизирует к шаблону олигонуклеотида, чья последовательность является дополнением желаемой радиомеченной пробы. Затем инициирующее вещество расширяется с использованием фрагмента Кленова E.coli ДНК полимеразы I для включения (альфа-32P)dNTP или (гамма-33P)dNTR в направляемой шаблоном манере. После реакции шаблон и продукт разделяются денатурированием, за чем следует электрофорез через полиакриламидный гель в условиях денатурации. С этим способом при желании можно формировать пробы олигонуклеотидов, содержащие несколько радиоактивных атомов на молекулу олигонуклеотида.

Чтобы использовать этот метод, нужно смешать в трубе микрофуги рассчитанные количества (альфа-32P)dNTP или (альфа-33P)dNTP, необходимые для достижения желаемой специфической активности и достаточные для получения полного синтеза всех прядей шаблона. Концентрация dNTP не должна быть меньше 1 мкМ на любом этапе в ходе реакции. Затем в трубу добавляются соответствующие количества инициирующего вещества и шаблона ДНК, причем инициирующее вещество в молярном отношении в 3-10 раз превышает шаблон.

Затем добавляется 0,1 объема 10 х буфера Кленова и хорошо перемешивается. Затем добавляются 2-4 единицы фрагмента Кленова E.coli ДНК полимеразы I на 3 мкл реакционного объема, перемешивается и выдерживается 2-3 часа при 4oC. При желании течение реакции можно отслеживать путем удаления небольших (0,1 мкл) кратных и измерения доли радиоактивности, которая стала способна осаждаться, 10% трихлороуксусной кислотой (ТСА).

Реакционная смесь разжижается равным объемом наполняющего гелем буфера, нагревается до 80oC в течение 3 минут и затем вся проба загружается на денатурирующий полиакриламидный гель. После электрофореза гель авторадиографируется, что позволяет найти пробу и удалить ее из геля. Имеются также следующие разные способы флуорофобного нанесения меток. Брамбо и др. (1988) описывают синтез флуоресцентно меченных инициирующих веществ. Аналог деоксиуридина с первичным аминовым "плечом образователя связи" из 12 атомов, прикрепленный у C-5, синтезируется. Синтез аналога состоит из дериватизации 2'-деоксиуридина через органометаллические промежуточные вещества с получением 5'(метил пропеноил)-2'-деоксиуридина. Реакция с диметокситритил-хлоридом дает соответствующий привод 5'-диметокситритил. Сложный эфир метила гидролизуется, активизируется и реагирует с соответствующим образом моноацилированным алкил диамином. После очистки результирующие нуклеозиды плеча образователя связи преобразуются в аналоги нуклеозида, способные для химического синтеза олигонуклеотида.

Затем получаются олигонуклеотиды, которые содержат одну или две базы с плечом образователя связи с использованием модифицированной химии фосфоридитов. В раствор 50 нмолей олигонуклеотида с плечом образователя связи в 25 мкл бикарбоната натрия 500 mM (pH 9,4) добавляются 20 мкл FITC 300 mM в диметил сульфоксиде. Смесь перемешивается при комнатной температуре 6 часов. Олигонуклеотид отделяется от свободного FITC путем элюирования из колонны Sephadex G-25 1 х 30 см с 20 vV ацетата аммония (pH 6) с комбинированием фракций в первом пике УФ-поглощения.

В общем случае флуоресцентное нанесение меток на олигонуклеотид у его 5'-конца в начале предполагало 2 этапа. Сначала N-защищенная производная аминоалкил фосфорамидита добавляется к 5'-концу олигонуклеотида во время автоматизированного синтеза ДНК. После удаления всех защищающих групп сложный эфир NHS соответствующего флуоресцентного красителя соединяется с 5'-амино-группой за полсуток, за чем следует очистка меченого олигонуклеотида от избытка красителя с использованием обратной фазы HPLC или PAGE.

Шуберт и др. (1990) описали синтез фосфорамидита, который позволяет получать олигонуклеотиды, меченные флуоресцеином во время автоматизированного синтеза ДНК. Метил-сложный эфир флуоресцеина алкилируется 4-хлоро(4,4'-диметокситритил)бутанолом-1 в присутствии K2CO3 и KI в DMF в течение 17 часов. После удаления группы тритила 1% TFAb в хлороформе продукт фосфитилируется стандартными процедурами посредством бис (диизопропиламино)метоксифосфина. Фосфорилирование указанной полученной производной флуоресцеина приводит к достаточному выходу H-фосфоната. Получающийся амидит (раствор 0,1 М в сухом ацетонитриле) используется для автоматизированного синтеза разных инициирующих веществ с использованием бета-цианоэтил фосфорамидитной химии и синтезатора ДНК. Отщепление от основы и депротекция осуществляются с помощью 25% водного раствора аммиака в течение 36 часов при комнатной температуре. Необработанный продукт очищается посредством PAGE, и меченое инициирующее вещество видимо как бледно-зеленая флуоресцентная полоса на 310 нм. Элюирование и обессолевание с использованием патронов RP 18 дают желаемый продукт.

Флуоресцентное мечение 5'-конца пробы в методе Шуберта непосредственно достигается во время синтеза ДНК в последнем цикле образования связей. Выход связей так же высок, как и с обычными фосфорамитидами. После депротекции и удаления аммиака путем лиофилизирования с использованием скоростного вакуума или осаждения этанолом меченные флуоресцентно олигонуклеотиды могут прямо применяться для образования последовательностей ДНК в формате 3 СПГ.

Мураками и др. также описывали приготовление меченных флуоресцеином олигонуклеотидов. Этот синтез основан на методе поддерживаемого полимером фосфорамитида и фосфоната водорода. Этилендиамин или гексаметилендиамин используется как привязь. Они вводятся через фосфорамидатную связь, которая была образована окислением водород-фосфонатного промежуточного вещества в растворе CCl4. Модифицированные олигонуклеотиды подвергаются мечению с использованием первичного амин-ориентирующего реагента, FITC, на шариках. Получающийся модифицированный олигонуклеотид отщепляется от шариков и затем очищается RPLC.

Кейт и др. (1991) описывают использование проб олигонуклеотидов, непосредственно сопряженных с алкалин фосфатазой в комбинации с прямой хемилюминесцентной подложкой (AMPPD), чтобы позволить обнаружение проб. Фосфатазу алкалина можно ковалентно соединить с модифицированной базой олигонуклеотида. После гибридизации олиго выдерживается в термостате с AMPDD. Фермент алкалин фосфатазы разбивает AMPDD с получением соединения, которое дает флуоресценцию без возбуждения, т.е. лазер не нужен. Считается, что сильный сигнал может формироваться с использованием такой технологии.

Меченые пробы можно свободно приобрести в разных промышленных источниках, включая GENsET, а не синтезировать.

Пример VI
Удаление фосфатных групп
Как алкалин фосфатаза бактерий (BAP), так и кишечная алкалин фосфатаза телят (CIP) катализируют удаление радикалов 5'-фосфата из ДНК и РНК. Поэтому они уместны для удаления 5'-фосфатов из ДНК или/и РНК для предотвращения образования связей и неправильной гибридизации. Удаление фосфатов, как оно описано Сэмбруком и др. (1989), осуществляется после разрезки или иного сдвига геномной ДНК.

BAP более активен из 2-х алкалин фосфатаз, но он также намного более стоек к нагреву и чистящим веществам. Поэтому трудно замедлить BAP полностью у конца реакций дефосфорилирования. Протеиназа K применяется для вываривания CIP, который должен быть полностью удален, если последующие связи должны эффективно работать. Альтернативный метод это инактивация CIP нагреванием до 65oC в течение 1 часа (или 75oC в течение 10 минут) в присутствии 5 mM EDTA (pH 8,0) с последующей очисткой дефосфорилированной ДНК экстрагированием с фенол: хлороформом.

Пример VII
Проведение образования последовательности путем двухэтапной гибридизации
Ниже следуют некоторые примеры для описания выполнения методологии образования последовательностей, рассматриваемой изобретателем. Сначала весь чип гибридизируется смесью ДНК сложностью 100 миллионов бп (1 хромосома человека). Руководство по проведению гибридизации можно найти в статьях, таких как Дрманач и др. (1990); Храпко и др. (1991) и Бруд и др. (1994). В этих статьях указаны диапазоны температур гибридизации, буферы и этапы промывки, которые пригодны для использования на начальном этапе формата 3 СПГ.

Данный изобретатель в особенности рассматривает проведение гибридизации в течение до нескольких часов при высоких концентрациях соли и при низкой температуре (от -2 до 5oC) из-за относительно малой концентрации получаемой целевой ДНК. Для этой цели применяется буфер SSC вместо буфера фосфата натрия (Дрманач и др. , 1990), который осаждается при 10oC. Промывка не обязательно должна быть экстенсивной (несколько минут) из-за второго этапа и может быть полностью исключена, если проведение циклов гибридизации используется для создания последовательности в высшей степени сложных образцов ДНК. Этот же буфер используется для этапов гибридизации и промывки, чтобы можно было продолжать второй этап гибридизации с мечеными пробами.

После должной промывки с использованием простого робототехнического устройства на каждом ряде, например, ряде 8 х 8 мм (пример III), добавляется одна меченая проба, например, 6-мер. Используется 96-кончиковое или 96-штырьковое устройство, выполняя это за 42 операции. Снова используется диапазон избирательных условий, как ранее описывалось в научной литературе.

Данный изобретатель в особенности рассматривает использование следующих условий. Сначала, после добавления меченых проб и выдержки только в течение нескольких минут (из-за высокой концентрации добавленных олигонуклеотидов) при низкой температуре (0-5oC) температура повышается до 3-10oC в зависимости от длины F+P и добавляется промывающий буфер. В это время используемый промывающий буфер совместим с любой реакцией образования связей (например, в диапазоне концентрации соли 100 mM). После добавления лигазы температура снова повышается до 15-37oC, чтобы позволить быстрому образованию связей (менее 30 мин) и дальнейшему избиранию гибридов с полным совпадением и несовпадениями.

Использование катионных чистящих (моющих) веществ также рассматривается для использования в формате 3 СПГ, как описано Понтиусом и Бергом (1991). Эти авторы описывают использование двух простых катионных чистящих веществ, дедецил- и цетилтриметиламмоний бромида (DTAB и CTAB) в повторной натурации ДНК.

DTAB и CTAB - это варианты четвертичного аминтетраметиламмоний бромида (TMAB), в котором одна из групп метила замещена либо 12-углеродной (DTAB), либо 16-углеродной (CTAB) алкильной группой. TMAB - это соль бромида иона тетраметиламмония, реагент, применяемый в экспериментах по повторному натурированию нуклеиновых кислот для уменьшения сдвига содержания G-C температуры расплавления. DTAB и CTAB аналогичны по структуре натрий додецил сульфату (SDS) с замещением отрицательно заряженного сульфата SDS положительно заряженным четвертичным амином. Хотя SDS обычно применяется в буферах гибридизации для уменьшения неспецифического образования связей и для замедления нуклеаз, он не сильно влияет на скорость повторного натурирования.

При проведении процесса образования связей можно добавить фермент в меченые пробы или после этапа должной промывки для снижения фона.

Хотя ее ранее не предлагали для использования с каким-либо методом СПГ, технология лигазы хорошо установлена в области молекулярной биологии. Например, Худ и коллеги описали метод обнаружения гена посредством лигазы (Ландегрен и др., 1988), методологию которого можно легко приспособить для использования в формате 3 СПГ. Ландегрен описывает анализ присутствия данных последовательностей ДНК на основе способности 2-х олигонуклеотидов отжигаться непосредственно рядом друг с другом на дополняющей целевой молекуле ДНК.

Затем два олигонуклеотида соединяются ковалентно под действием ДНК лигазы при условии, что нуклеотиды у места соединения правильно спарены базами. Хотя это ранее не рассматривалось, эта ситуация теперь возникает в образовании последовательности в формате 3. Ву и Уоллас также описывают использование бактериофаг T4 ДНК лигазы для соединения двух соседних коротких синтетических олигонуклеотидов. Их реакции образования связи олиго проводились в 50 mM Tris HCl pH 7,6, 10 mM MgCl2, 1 mM ATP, 1 mM DTT и 5% PEG. Реакции образования связи проводились при нагревании до 100oC в течение 5-10 мин, за чем следовало охлаждение до 0oC до добавления T4 ДНК лигазы (1 единица; Bethesda Research Laboratory). Большинство реакций образования связей проводилось при 30oC и заканчивалось нагреванием до 100oC в течение 5 мин.

Затем проводится конечная промывка, пригодная для избирательного обнаружения гибридизированных соседних, или образовавших связь, олигонуклеотидов с длиной (F+P). Этот этап промывки проводится в воде в течение нескольких минут при 40-60oC для вымывания всех необразовавших связи меченых проб и всех других соединений, чтобы максимально уменьшить фон. Благодаря ковалентно связанным меченым олигонуклеотидам обнаружение упрощается (с ним не связаны ограничения по времени и низкой температуре).

В зависимости от используемой метки получение изображений чипов производится на разных аппаратах. Для радиоактивных меток можно использовать технологию хранения фосфора с экраном и PhosphorImager в качестве сканера (фирма Molecular Dynamics, Саннивейл, Калифорния). Чипы помещаются в кассету и накрываются фосфористым экраном. После 1-4 часов воздействия экран сканируется и файл изображения хранится на твердом диске компьютера.

Для обнаружения флуоресцентных меток используются камеры с ПЗС и эпифлуоресцентная или конфокальная микроскопия. Для чипов, сформированных прямо на элементах изображения камеры с ПЗС, обнаружение может проводиться, как описано Эггерсом и др. (1994).

Детекторы с приборами с зарядовой связью (ПЗС) служат в качестве активных твердых основ, которые количественно обнаруживают и формируют изображение распределения меченых целевых молекул в анализах на основе проб. В этих устройствах используются присущие микроэлектронике характеристики, которые сочетают в высшей степени параллельные анализы, сверхчувствительное обнаружение, высокую производительность (пропускную способность), интегральный сбор данных и вычисление. Эггерс и др. (1994) описывают применение ПЗС для основанных на пробах анализов, таких, как формат 3 СПГ настоящего изобретения, которые позволяют количественную оценку с точностью до секунд благодаря высокой чувствительности и применяемой прямой связи.

Подход интегрального обнаружения с ПЗС позволяет проводить обнаружение событий образования молекулярных связей на чипах. Детектор быстро формирует двумерную картину, которая уникально характеризует образец. В конкретной работе молекулярного детектора на базе ПЗС отдельные биологические пробы связываются (нейтрализуются) непосредственно на элементах изображения ПЗС и могут прикрепляться к одноразовой полоске-крышке, помещенной на поверхность ПЗС. Молекулы образца можно метить радиоизотопом, хемилюминесцентными или флуоресцентными ярлыками.

После воздействия на образец ряда проб на основе ПЗС фотоны или продукты затухания радиоизотопа испускаются у местоположений элементов изображения, где образец образовал связи, в случае формата 3, с двумя дополняющими пробами.

В свою очередь пары электрон-дырка генерируются в кремнии, когда заряженные частицы или излучение от меченых образцов
падают на управляющие электроды ПЗС. Затем электроны собираются под соседними управляющими электродами ПЗС и последовательно считываются на модуле дисплея. Количество фотоэлектронов, генерируемое у каждого элемента изображения, прямо пропорционально количеству молекулярных событий образования связей в такой ближайшей области. Следовательно, образование молекулярных связей можно определять количественно (Эггерс и др., 1994).

Как недавно сообщалось, ПЗС на базе кремния имеют преимущества как полупроводниковые датчики обнаружения и формирования изображений прежде всего благодаря высокой чувствительности устройств в широком диапазоне длин волн (от 1 до 10000 ангстрем). Кремний очень чувствителен к электромагнитному излучению от видимого спектра до мягких рентгеновских лучей. Для видимого света один фотон, падающий на управляющий электрод ПЗС, приводит к появлению одного заряженного электроном пакета под электродом. Одна бета-частица мягкого рентгеновского излучения (обычно в диапазоне КэВ до МэВ) генерирует от тысяч до десятков тысяч электронов. Вдобавок к высокой чувствительности ПЗС, описанные Эггерсом и др. (1994), предоставляют широкий динамический диапазон (4-5 порядков величины), поскольку обнаружаемый пакет заряда может включать от нескольких до 105 электронов. Характеристика обнаружения является линейной в широком динамическом диапазоне.

Путем размещения создающего изображения ряда вблизи от образца эффективность сбора улучшается, как минимум, в 10 раз по сравнению с методами на основе линзы, такими, какие применяются в обычных камерах на ПЗС. То есть образец (эмиттер) находится в близком контакте с детектором (матрицей формирования изображения) и это исключает обычную оптику формирования изображений, такую, как линзы и зеркала.

Когда радиоизотопы прикреплены как сообщающие группы к целевым молекулам, энергетические частицы обнаруживаются. Несколько сообщающих групп, которые излучают частицы с разной энергией, успешно использовались с микроизготовленными детекторами, такие как 32P, 33P, 35S, 14C, 125L. Частицы с более высокой энергией, такие как от 32P, обеспечивают самую высокую чувствительность молекулярного обнаружения, тогда как частицы с более низкой энергией, такие, как от 35S, обеспечивают лучшее разрешение. Поэтому выбор сообщающего радиоизотопа может быть сделан по желанию. Когда конкретная радиоизотопная метка выбрана, характеристики обнаружения можно предсказать путем расчета отношения сигнал-шум, как описано Эггерсом и др. (1994).

Альтернативная процедура люминесцентного обнаружения предполагает использование флуоресцентных или хемилюминесцентных сообщающих групп, прикрепленных к целевым молекулам. Флуоресцентные метки можно прикреплять ковалентно или через взаимодействие. Флуоресцентные красители, такие, как бромид этидия с сильными полосами поглощения в диапазоне ближнего УФ (300-350 нм) и основными полосами излучения в видимом диапазоне (500-650 нм) наиболее пригодны для используемых устройств с ПЗС, поскольку квантовая эффективность на несколько порядков величины ниже на длине волны возбуждения, чем на длине волны флуоресцентного сигнала.

С точки зрения обнаружения люминесценции многокремниевые управляющие электроды (схемы) ПЗС имеют "встроенную" способность отфильтровывать вклад падающего света в УФ-диапазоне, но они очень чувствительны к видимой люминесценции, генерируемой флуоресцентными сообщающими группами.

Такая присущая большая избирательность относительно УФ-возбуждения позволяет достигать высоких отношений сигнал-шум (более 100) с помощью ПЗС, как указывалось в статье Эггерса и др. (1994).

Для связывания проб на детекторе можно получить матрицы гибридизации на недорогих подложках из SiO2, которые затем помещают на поверхность ПЗС после гибридизации и сушки. Этот формат экономически эффективен, т.к. гибридизация ДНК проводится на недорогих одноразовых подложках из SiO2, что позволяет повторно использовать более дорогой детектор на ПЗС. В качестве альтернативы пробы можно связывать прямо на ПЗС с созданием специализированной матрицы проб.

Чтобы связать пробы на покрытии SiO2, однородный эпоксидный слой связывается с поверхностью пленки с использованием эпоксидно-силанового реагента и стандартной химии модификации SiO2. Затем амин-модифицированные пробы олигонуклеотидов связываются с поверхностью SiO2 посредством вторичного образования аминов с эпоксидным кольцом. Получающаяся связь создает 17 способных вращаться связей разделения между 3' базой олигонуклеотида и поверхностью SiO2. Чтобы обеспечить полную депротонацию аминов и минимизировать образование вторичной структуры во время создания связи, реакцию проводят в 0,1 М KOH и выдерживают при 37oC 6 часов.

В формате 3 СПГ вообще сигналы считаются на каждую из миллиарда точек. Будет необходимо гибридизировать все ряды, например, 4000 5 х 5 мм за 1 раз и возможно последующее использование меньшего числа рядов.

Гибридизации с проведением циклов - это один возможный способ увеличения сигналов гибридизации. За 1 цикл большинство фиксированных проб гибридизируют с фрагментами ДНК с хвостовыми последовательностями, некомплементарными для меченых проб. При увеличении температуры эти гибриды будут расплавляться (фиг. 3). За следующий цикл некоторые из них (около 0,1%) гибридизируются с соответствующим фрагментом ДНК и дополнительные меченые пробы образуют связи. В этом случае происходит избирательное плавление гибридов ДНК с несовпадениями одновременно для обоих наборов проб.

В гибридизации с проведением циклов все компоненты добавляются до начала циклов при 37oC для T4 или при более высокой температуре для термостабильной лигазы. Затем температура снижается до 15-37oC и чип выдерживается до 10 минут, а потом температура повышается до 37oC или выше в течение нескольких минут, и потом снова уменьшается. Циклы можно повторить до 10 раз. В одном варианте оптимальную более высокую температуру (10-50oC) можно использовать без циклов и можно провести более длинную реакцию образования связей (1-3 часа).

Описанная здесь процедура позволяет изготовлять сложные чипы с использованием стандартного синтеза и точного определения мест олигонуклетидов, потому что нужно относительно небольшое количество олигонуклеотидов. Например, если все 7-мерные олиго синтезированы (16384 пробы), можно определить списки 256 миллиона 14-меров.

Один важный вариант изобретенного способа заключается в применении более чем 1 по-разному меченую пробу на базовый ряд. Это можно выполнить, имея в виду 2 цели; мультиплексирование для снижения числа отдельно гибридизированных рядов; или определение списка еще более длинных олиго-последовательностей, таких, как 3 х 6 или 3 х 7. В этом случае, если используются 2 метки, специфичность 3 последовательных олигонуклеидов может быть почти абсолютной, потому что положительные места должны иметь достаточное количество сигналов обоих меток.

Еще один дополнительный вариант - использовать чипы, содержащие пробы BxNy, где y составляет от 1 до 4. Эти чипы позволяют считывать последовательности в разных кадрах. Этого можно также достигнуть путем использования соответствующих наборов меченых проб или обе пробы F и P могут иметь некоторые неспецифицированные концевые позиции (т.е. некоторый элемент с оконечным вырождением). Можно также использовать универсальные базы как часть образователя связи для соединения проб с определенной последовательностью с твердой основой. Это делает пробу более готовой к гибридизации и делает строение более стабильным. Если проба имеет 5 баз, можно, например, использовать 3 универсальные базы как образователь связи (фиг. 4).

Пример VIII
Анализ полученных данных
Файлы с изображениями анализируются программой анализа изображений, такой, как программа DOTS (Дрманач и др., 1993), и шкалируются и оцениваются включенными статистическими функциями, например, в программу SCORES (Дрманач и др. , 1994). Из распределения сигналов определяется оптимальный порог для преобразования сигнала в +/- выход.

Из положения обнаруженной метки определяется F+P последовательности нуклеотидов из фрагментов путем комбинирования известных последовательностей связанных и меченых проб, соответствующих меченым позициям. Полная последовательность нуклеиновой кислоты или подфрагменты последовательности первоначальной молекулы, такой, как хромосома человека, затем собираются из перекрывающихся последовательностей F+P, определенных вычислительным вычитанием.

Один вариант состоит в преобразовании сигналов гибридизации, например меток, в +/- выход во время процесса сборки последовательности. В этом случае сборка начинается с последовательности F+P с очень большим счетом, например, с F+P последовательности AAAAAATTTTTT (посл. ид. N.1). Счета всех 4-х возможных перекрывающихся проб AAAAATTTTTTA (посл. ид. N.3), AAAAATTTTTTT (посл. ид. N.4), AAAAATTTTTTC (посл. ид. N.5) и AAAAATTTTTTG (посл. ид. N.6) и 3 дополнительные пробы, которые отличны в начале (TAAAAATTTTTT, посл. ид. N. 7; CAAAAATTTTTT, посл. ид. N.8; GAAAAATTTTTT, посл. ид. N.9) сравниваются и определяются 3 результата: (1) только начальная проба и только 1 из 4-х перекрывающихся проб имеют счета, которые значительного положительны по отношению к другим 6 пробам, в этом случае последовательность AAAAAAATTTTTT (посл. ид. N.1) будет продлена на 1 нуклеотид вправо; (2) ни одна проба, за исключением начальный пробы, имеет значительно положительный счет, сборка остановится, например, последовательность AAAAAATTTTT (посл. ид. N.10) находится на конце молекулы ДНК, последовательность которой создается; (3) обнаружена более чем 1 значительно положительная проба среди перекрывшихся или/и других 3-х проб; сборка останавливается из-за ошибки или разветвления (Дрманач и др., 1989).

Процессы вычислительного вычитания используют компьютерные программы с применением существующих алгоритмов (см., например, Певзнер, 1989; Дрманач и др., 1991; Лабат и Дрманач, 1993).

Если вдобавок к F+P F(пространство 1)P, F(пространство 2)P, F(пространство 3)P или F(пространство 4)F определяются, алгоритмы будут использоваться, чтобы совместить все наборы данных для корректировки потенциальных ошибок или для разрешения ситуации, когда имеется проблема разветвления (см., например, Дрманач и др., 1989; Бейнс и др., 1988).

Пример IX
Повторное использование чипов создания последовательности
Если образование связей используется в процессе создания последовательности, то обычный чип олигонуклеотидов нельзя сразу же повторно использовать. Изобретатель рассматривает, что это можно решить разными способами.

Можно использовать рибонуклеотиды для второй пробы, пробы P, так что эту пробу можно затем удалить обработкой PHКазой. В обработке PHКазой может использоваться PHКаза A, эндорибонуклеаза, которая специфически разъедает одно-свитую РНК 3' до радикалов пиримидина и расщепляет связь фосфата до соседнего нуклеотида. Конечными продуктами являются пиримидин 3' фосфаты и олигонуклеотиды с оконечными пиримидин 3' фосфатами. PHКаза A работает в отсутствии адъюнктов и двухвалентных катионов.

Чтобы использовать PHКазу, обычно выдерживают чип в любом пригодном содержащем PHКазу буфере, как описано Сэмбруком и др. (1989). Уместно использовать 30-50 мкл содержащего PHКазу буфера на 8 х 8 мм или 9 х 9 мм матрицы при 37oC от 10 до 60 минут. Затем промывают буфером гибридизации.

Хотя это не применяется широко, можно также использовать базу урацила, как описали Крейг и др. (1989), в конкретных примерах осуществления. Разрушение комбинаций связанной пробы для получения повторно используемого чипа можно достичь вывариванием ремонтным ферментом E.coli, ураци-ДНК гликосилазой, которая удаляет урацил из ДНК.

Можно также сформировать специфично расщепляемую связь между пробами и затем расщепить связь после обнаружения. Например, этого можно достичь химическим образованием связи, как описано Шабаровой и др. (1991) и Долинной и др. (1988).

Шабарова и др. (1991) описывают конденсацию олигодеоксирибо нуклеотидов цианоген бромидом как конденсирующим веществом. В их одноэтапной химической реакции образования связи олигонуклеотиды нагреваются до 97oC, медленно охлаждаются до 0oC, затем добавляется 1 мкл 10 М BrCN в ацетонитриле.

Долинная и др. (1988) показывают как включать межнуклеотидные связи фосфорамидата и пирофосфата в дуплексы ДНК. Они также используют метод образования химической связи для модификации сахаро-фосфатного основания ДНК с растворимым в воде карбодиимидом (CDI) как связующим веществом. Селективное расщепление фосфоамидных связей предполагает контакт с 15% CH3COOH в течение 5 мин при 95oC. Селективное расщепление связи пирофосфата предполагает контакт со смесью пиридин-вода (9: 1) и с только что дистиллированным (CF3CO)2O.

Хотя соединения и способы согласно этому изобретению были описаны в терминах предпочтительных примеров его осуществления, для специалистов будет очевидно, что можно изменить соединение, способы и этапы или последовательность этапов описанного здесь способа, не отходя от замысла, духа и объема изобретения. Более конкретно очевидно, что некоторые вещества, которые связаны химически и физиологически, могут заменяться описанными здесь веществами, и будут получены те же самые или похожие результаты. Все такие аналогичные заменители и модификации, очевидные для специалистов, считаются находящимися в духе, рамках и замысле изобретения, определяемого прилагаемой формулой изобретения. Все заявленное, вещества и способы, могут получаться и выполняться без ненужного экспериментирования.


Формула изобретения

1. Способ определения последовательности молекулы нуклеиновой кислоты, отличающийся тем, что проводят гибридизацию молекулы с комплементарными последовательностями олигонуклеотидов из двух наборов малых олигонуклеотидных зондов известной последовательности, причем первый набор зондов прикреплен к твердой подложке, а второй набор зондов представляет собой меченые зонды, находящиеся в растворе, создают ковалентные связи между гибридизированным олигонуклеотидом из указанного первого набора зондов и гибридизированным олигонуклеотидом из указанного второго набора зондов, идентифицируют ковалентно связанные участки последовательности и определяют последовательность молекулы нуклеиновой кислоты с использованием указанных идентифицированных участков.

2. Способ по п.1, отличающийся тем, что указанную гибридизацию осуществляют циклами.

3. Способ по п.1, отличающийся тем, что предварительно проводят фрагментацию молекулы нуклеиновой кислоты с получением фрагментов нуклеиновой кислоты промежуточной длины.

4. Способ по п.3, отличающийся тем, что полученные фрагменты последовательно гибридизируют с комплементарными последовательностями из указанных двух наборов малых олигонуклеотидных зондов известной последовательности.

5. Способ по п.3, отличающийся тем, что полученные фрагменты одновременно гибридизируют с комплементарными последовательностями из двух наборов малых олигонуклеотидных зондов известной последовательности.

6. Способ по п.3, отличающийся тем, что получают фрагменты молекулы нуклеиновой кислоты, длина которых составляет от примерно 10 до примерно 40 нуклеотидов, при этом используют малые олигонуклеотидные зонды, длина которых составляет примерно от 4 до 9 нуклеотидов.

7. Способ по п.3, отличающийся тем, что проводят гибридизацию указанных олигонуклеотидных зондов с полностью комплементарными последовательностями указанных фрагментов.

8. Способ по п. 3, отличающийся тем, что проводят гибридизацию олигонуклеотидных зондов с непосредственно соседними последовательностями указанных фрагментов.

9. Способ по п. 8, отличающийся тем, что проводят гибридизацию олигонуклеотидных зондов с полностью комплементарными и непосредственно соседними последовательностями указанных фрагментов.

10. Способ по п.3, отличающийся тем, что используют олигонуклеотидные зонды, ковалентно связанные ферментной связью.

11. Способ по п.3, отличающийся тем, что используют олигонуклеотидные зонды, ковалентно связанные посредством химического лигирующего агента.

12. Способ по п.3, отличающийся тем, что при гибридизации проводят контактирование указанного первого набора малых прикрепленных олигонуклеотидных зондов с указанными фрагментами нуклеиновой кислоты промежуточной длины в условиях, позволяющих только таким фрагментам с полностью комплементарной последовательностью гибридизироваться с зондом с образования первичных комплексов, в которых фрагмент имеет гибридизированные и свободные последовательности, проводят контактирование указанных первичных комплексов с указанным вторым набором малых меченных олигонуклеотидных зондов в условиях, позволяющих только таким зондам с полностью комплементарными последовательностями гибридизироваться со свободной последовательностью фрагмента с образования вторичных комплексов, в которых фрагмент гибридизирован с прикрепленным зондом и меченым зондом, образуют ковалентную связь между указанным прикрепленным зондом и указанным меченым зондом, удаляют из указанных вторичных комплексов меченых зондов, не связанных ковалентно с прикрепленным зондом, с образованием ковалентно связанных комплексов, идентифицируют ковалентно связанные комплексы путем обнаружения наличия метки, определяют последовательности фрагментов нуклеиновой кислоты в указанных ковалентно связанных комплексах путем соединения известных последовательностей гибридизированных прикрепленных и меченых зондов.

13. Способ определения последовательности молекулы нуклеиновой кислоты, отличающийся тем, что проводят фрагментацию молекулы нуклеиновой кислоты с получением фрагментов длиной Т, приготавливают ряд иммобилизованных олигонуклеотидных зондов с известными последовательностями и с длиной F и набора меченных олигонуклеотидных зондов в растворе с известными последовательностями и с длиной Р, причем F + P < T, производят контактирование указанного ряда иммобилизованных олигонуклеотидных зондов с указанными фрагментами нуклеиновой кислоты в условиях гибридизации, позволяющих образовываться первичным комплексам с гибридизированными, полностью комплементарными последовательностями длиной F и с негибридизированными последовательностями фрагментов с длиной T - F, производят контактирование указанных комплексов с указанным набором меченных олигонуклеотидных зондов в условиях гибридизации, позволяющих образовываться только вторичным комплексам с гибридизированными, полностью комплементарными последовательностями с длиной F и с непосредственно соседними гибридизированными полностью комплементарными последовательностями с длиной P, образуют ковалентную связь между указанными меченными олигонуклеотидными зондами и указанными непосредственно соседними иммобилизованными олигонуклеотидными зондами, обнаруживают указанные вторичные комплексы по присутствию метки, идентифицируют последовательности с длиной F + P фрагментов молекулы нуклеиновой кислоты в указанных комплексах путем объединения известных последовательностей гибридизированных иммобилизованных и меченых зондов, определяют перекрывающиеся участки указанных последовательностей с длиной F + P с последующим определением полной последовательности молекулы нуклеиновой кислоты.

14. Способ по п.13, отличающийся тем, что длина Т примерно в три раза превышает длину F.

15. Способ по п.13, отличающийся тем, что длина Т составляет примерно от 10 до 100 нуклеотидов, длина F составляет примерно от 4 до 9 нуклеотидов, а длина P составляет примерно от 4 до 9 нуклеотидов.

16. Способ по п.15, отличающийся тем, что длина Т составляет примерно 20 нуклеотидов, длина F составляет примерно 6 нуклеотидов, а длина Р составляет примерно 6 нуклеотидов.

17. Способ по п.13, отличающийся тем, что ковалентное связывание между непосредственно соседними иммобилизованными и меченными олигонуклеотидными зондами осуществляют ферментной связью.

18. Способ по п.13, отличающийся тем, что ковалентную связь между непосредственно соседними иммобилизованными и меченными олигонуклеотидными зондами образовывают с использованием химического лигирующего агента.

19. Способ по п.13, отличающийся тем, что используют нуклеиновую кислоту, представляющую собой клонированную ДНК или хромосомную ДНК.

20. Способ по п.13, отличающийся тем, что используют нуклеиновую кислоту, представляющую собой мРНК.

21. Способ по п.13, отличающийся тем, что фрагментирование молекулы нуклеиновой кислоты проводят гидролизом рестриказой, ультразвуковой обработкой, обработкой гидроксидом натрия или гидродинамическим фрагментированием при низком давлении.

22. Способ по п.13, отличающийся тем, что используют иммобилизованные олигонуклеотиды, прикрепленные к стеклянной, полистирольной или тефлоновой твердой подложке.

23. Способ по п.13, отличающийся тем, что используют иммобилизованные олигонуклеотиды, прикрепленные к твердой подложке посредством фосфодиэстерной связи.

24. Способ по п.13, отличающийся тем, что используют иммобилизованные олигонуклеотиды, прикрепленные к твердой подложке посредством светоактивируемого механизма.

25. Способ по п.13, отличающийся тем, что используют меченные нерадиоактивным изотопом или флуоресцентным красителем олигонуклеотидные зонды.

26. Способ по п.13, отличающийся тем, что используют меченные изотопами 35S, 32P или 33P олигонуклеотидные зонды.

27. Способ по п.13, отличающийся тем, что указанный фрагмент молекулы нуклеиновой кислоты или один из нуклеотидов зондов содержат модифицированную или универсальную основу.

28. Способ по п.13, отличающийся тем, что меченые зонды, не связанные ковалентно с иммобилизованным зондом, удаляют из вторичных комплексов промывкой в строгих условиях.

29. Способ по п. 13, отличающийся тем, что используют множество рядов иммобилизованных олигонуклеотидов, расположенных в виде задающего последовательность чипа.

30. Набор для использования при определении последовательности молекулы нуклеиновой кислоты, отличающийся тем, что он содержит чип с твердой подложкой, имеющий прикрепленный комплект олигонуклеотидных зондов известных последовательностей, причем указанные олигонуклеотиды способны принимать участие в реакциях гибридизации, а также набор контейнеров с растворами меченых олигонуклеотидных зондов известных последовательностей и лигирующий агент.

31. Набор по п.30, отличающийся тем, что используемое множество чипов иммобилизованных олигонуклеотидов установлено в виде ранжированного ряда.

32. Набор по п.30, отличающийся тем, что используемые олигонуклеотидные зонды имеют в длину примерно от 4 до 9 нуклеотидов.

33. Набор по п.32, отличающийся тем, что используемые олигонуклеотидные зонды имеют в длину примерно 6 нуклеотидов.

34. Набор по п.30, отличающийся тем, что используемые олигонуклеотидные зонды прикреплены к стеклянной, полистирольной или тефлоновой твердой подложке.

35. Набор по п.30, отличающийся тем, что олигонуклеотидные зонды прикреплены к твердой подложке посредством фосфодиэстерной связи.

36. Набор по п.30, отличающийся тем, что олигонуклеотидные зонды прикреплены к твердой подложке посредством светоактивируемого механизма.

37. Набор по п.30, отличающийся тем, что олигонуклеотидные зонды мечены нерадиоактивным изотопом или флуоресцентным красителем.

38. Набор по п.30, отличающийся тем, что один из используемых олигонуклеотидов содержит модифицированную или универсальную основу.

39. Набор по п.30, отличающийся тем, что олигонуклеотидные зонды мечены изотопами 35S, 32P или 33P.

40. Набор по п.30, отличающийся тем, что в качестве лигирующего агента использован химически лигирующий агент.

41. Набор по п.30, отличающийся тем, что в качестве лигирующего агента использован фермент лигазы ДНК.

РИСУНКИ

Рисунок 1, Рисунок 2, Рисунок 3, Рисунок 4, Рисунок 5, Рисунок 6, Рисунок 7, Рисунок 8, Рисунок 9, Рисунок 10, Рисунок 11



 

Похожие патенты:

Изобретение относится к биотехнологии и может быть использовано для выявления веществ с фармакологическим действием

Изобретение относится к способу и набору для обнаружения присутствия каталитически активных рибозимов в среде

Изобретение относится к целенаправленной блокировке генетической информации вирусной мРНК для репликации ретровирусов, например HIV, в трансфецированных гематопоэтических клетках, более конкретно, к плазмидам для экспрессии анти-мРНК ретровируса HIV-1

Изобретение относится к области генетики, связанной с расширением спектра исходных форм селекции путем искусственного создания новых мутантных форм растений

Изобретение относится к ветеринарной вирусологии, а именно к способу и набору для обнаружения ДНК возбудителя африканской чумы свиней (АЧС) в культуре инфицированных клеток и пробах патологических материалов от свиней

Изобретение относится к биотехнологии, медицинской микробиологии

Изобретение относится к диагностике инфекционных заболеваний, основанном на обнаружении генетического материала (ДНК или РНК) возбудителя

Изобретение относится к биотехнологии, молекулярной биологии и медицине

Изобретение относится к вирусологии, медицине, а именно к применению алкилирующих производных фосфотиоатных аналогов олигонуклеотидов общей формулы где В - остаток тимина, цитозина, аденина или гуанина; RCl - остаток алкилирующего амина, например 4-(N-метил-N-2-хлорэтиламино)бензилметиламина n = 12-30, в качестве ингибитора репродукции вируса иммунодефицита человека (ВИЧ)

Изобретение относится к обнаружению, клонированию и анализу последовательности ДНК генома вируса куриной анемии (КАВ)

Изобретение относится к молекулярной биологии и может быть использовано для диагностики генетических заболеваний

Изобретение относится к молекулярной биологии и биотехнологии
Изобретение относится к медицинской микробиологии и может быть использовано для ускоренного обнаружения чумной инфекции в объектах внешней среды

Изобретение относится к медицине и касается способа выявления вируса гепатита С в сыворотке крови человека

Изобретение относится к молекулярной биологии и медицине и может быть использовано для быстрого обнаружения аллеля с мутацией F508 в гене трансмембранного регуляторного белка муковисцидоза (ТРБМ) при массовом скрининге образцов
Наверх