Вычислительный анализ биологических данных с применением многообразия и гиперплоскости

Авторы патента:


Группа изобретений относится к области медицины, более конкретно к вычислительному анализу биологических данных. Предложены варианты способа определения бактериальной инфекции на основании биологических данных, содержащих значения экспрессии множества полипептидов в крови субъекта, где значения экспрессии вводят в память аппаратного обрабатывающего устройства, а также машиночитаемый носитель данных для осуществления этих способов. В одном из вариантов способ характеризуется тем, что используют аппаратное обрабатывающее устройство для выполнения хранимых на машиночитаемом носителе компьютерных программных инструкций, которые включают: компьютерные программные инструкции для вычисления расстояния d между сегментом SROI кривой S и осью π, образованной направлением, при этом d вычисляют перпендикулярно оси π между точкой Р на оси π и соответствующей точкой на кривой S, при этом указанные точки образованы координатой δ1 вдоль указанного направления; и компьютерные программные инструкции для коррелирования указанного расстояния d с присутствием, отсутствием или вероятностью того, что субъект имеет бактериальную инфекцию, и для генерирования на графическом пользовательском интерфейсе выходных данных указанного присутствия, отсутствия или вероятности, при этом если d выше предварительно определенного уровня ωB, то данные компьютерные программные инструкции определяют, что субъект вероятно имеет бактериальную инфекцию, при этом координата δ1 образована комбинацией указанных значений экспрессии, которая включает линейную комбинацию этих значений экспрессии, причем по меньшей мере 90% указанного сегмента заключено между нижней ограничивающей прямой f(δ1)-ε0 и верхней ограничивающей прямой f(δ1)+ε1, где f(δ1) равняется 1/(1+exp(δ1)) и каждый из ε0 и ε1 составляет менее 0,5. Группа изобретений обеспечивает более точное определение наличия у субъекта бактериальной инфекции. 3 н. и 14 з.п. ф-лы, 14 пр., 38 табл., 39 ил.

 

РОДСТВЕННЫЕ ЗАЯВКИ

Данная заявка притязает на приоритет предварительных заявок на патент США 62/037180, поданной 14 августа 2014 г., и 62/105938, поданной 21 января 2015 г, содержание которых полностью приведено здесь для ссылки.

ОБЛАСТЬ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ, И УРОВЕНЬ ТЕХНИКИ

Настоящее изобретение в рамках некоторых вариантов его осуществления относится к вычислительному анализу и, более конкретно, но не исключительно, к вычислительному анализу биологических данных, например с целью обеспечения различения бактериальной инфекции и небактериального заболевания, и/или бактериальной инфекции и вирусной инфекции, и/или инфекционного и неинфекционного заболевания.

Антибиотики (Abx) представляют собой наиболее часто назначаемый класс лекарств с глобальным рынком в размере 25-30 миллиардов долларов США. Abx также представляют собой тип лекарства, который наиболее часто подвергается неправильному применению среди значительной (40-70%) доли всех лекарств, подвергаемых неправильному назначению (binder, J.A. and R.S. Stafford 2001; Scott, J.G. and D. Cohen, et al. 2001; Davey, P. and E. Brown, et al. 2006; Cadieux, G. and R. Tamblyn, et al. 2007; Pulcini, C. and E. Cua, et al. 2007), ("CDC - Get Smart: Fast Facts About Antibiotic Resistance" 2011).

Один из типов неправильного применения Abx заключается во введении лекарства в случае небактериального заболевания, такого как вирусная инфекция, при котором Abx является неэффективным. Например, в соответствии с данными CDC (центра по контролю распространения и предотвращению заболеваний США), в США ежегодно происходит свыше 60 миллионов случаев неправильного назначения Abx для лечения гриппа. Здравоохранительные и экономические последствия чрезмерного назначения Abx включают: (i) стоимость излишне назначаемых антибиотиков в глобальном масштабе оценивается в >10 миллиардов долларов США ежегодно; (ii) побочные эффекты, возникающие вследствие излишнего лечения с применением Abx, снижают качество здравоохранения, вызывая осложнения и пролонгированную госпитализацию (например, аллергические реакции, Abx-ассоциированную диарею, возникновение кишечной дрожжевой инфекции и так далее), и (iii) возникновение резистентных штаммов бактерий в результате бесконтрольного применения (CDC провозгласил повышение резистентности бактерий к антибиотикам "одной из наиболее серьезных проблем здравоохранения в мире в 21-м веке" (Arias, С.A. and В.Е. Murray 2009; "CDC - About Antimicrobial Resistance" 2011).

Недостаточное назначение антибиотиков также не является редким явлением. Например, до 15% госпитализированных взрослых пациентов с пневмонией в США получают лечение с применением Abx с задержкой или не получают его вовсе, даже несмотря на то, что в данных случаях раннее лечение может обеспечивать спасение жизней и уменьшать осложнения (Houck, P.M. and D. W. Bratzler, et al. 2002).

Технологии для диагностирования инфекционных заболеваний обладают потенциалом в плане снижения связанной с состоянием здоровья и стоимостью нагрузки, возникающей вследствие неправильного применения Abx. В идеальном случае подобная технология должна: (i) обеспечивать точное различение бактериальных и вирусных инфекций; (ii) быть быстрой (в течение нескольких минут); (iii) быть способной обеспечивать различение патогенных и непатогенных бактерий, которые являются частью естественной флоры организма; (iv) обеспечивать различение смешанных сопутствующих инфекций и чистых вирусных инфекций; и (v) быть применимой в случаях, когда патоген является недоступным (например, при синусите, пневмонии, среднем отите, бронхите и так далее).

Современные решения (такие как культуральные анализы, ПЦР и иммуноанализы) не соответствуют всем этим требованиям: (i) некоторые из данных анализов обеспечивают низкую диагностическую точность (например, низкую чувствительность или специфичность) (Uyeki et al. 2009) и ограничены лимитированным набором бактериальных или вирусных штаммов; (ii) они зачастую требуют от нескольких часов до нескольких дней; (iii) они не обеспечивают различения патогенных и непатогенных бактерий (Del Mar, С 1992), таким образом приводя к ложноположительным результатам; (iv) они зачастую неспособны обеспечивать различение смешанных и чистых вирусных инфекций; и (v) они требуют прямого забора образца в области нахождения инфекции, в которой ищут следы вызвавшего заболевание агента, что, таким образом, делает невозможным диагностирование в случаях, когда патоген находится в недоступной ткани, что зачастую и является причиной возникновения заболевания.

Соответственно, все еще сохраняется связанный с диагностикой пробел, который в свою очередь часто приводит к чрезмерному назначению Abx (подход "на всякий случай") или недостаточному назначению Abx (подход "подождем и посмотрим") лечащими врачами (Little, P.S. and I. Williamson 1994; Little, P. 2005; Spiro, D.M. and K.Y. Tay, et al. 2006), оба из которых имеют далеко идущие последствия, связанные с состоянием здоровья и финансовыми расходами.

Соответственно, существует потребность в быстром способе, обеспечивающем точное различение пациентов с бактериальными (включая смешанную бактериальную плюс вирусную инфекцию), вирусными и небактериальными невирусными заболеваниями, который отвечает на данные вызовы.

В заявке WO 2013/117746 описаны сигнатуры и детерминанты для различения бактериальной и вирусной инфекции.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

В соответствии с одним аспектом некоторых вариантов осуществления настоящего изобретения предусмотрен способ анализа биологических данных, при этом биологические данные содержат значения экспрессии множества полипептидов в крови субъекта. Способ включает: вычисление расстояния между сегментом кривой и осью, образованной направлением, при этом расстояние вычисляется в точке кривой, образованной координатой δ1 вдоль направления. Способ также включает определение корреляции расстояния с присутствием, отсутствием или вероятностью того, что субъект имеет бактериальную инфекцию. Координата δ1 определяется на основе комбинации значений экспрессии, при этом, по меньшей мере, 90% сегмента заключено между нижней ограничивающей прямой f(δ1)-ε0 и верхней ограничивающей прямой f(δ1)+ε1, при этом f(δ1) равняется 1/(1+ехр(δ1)), и при этом каждый из ε0 и ε1 составляет менее 0,5.

В соответствии с некоторыми вариантами осуществления изобретения способ включает определение вероятности на основе расстояния, сравнение вероятности с предварительно определенным пороговым значением и лечение бактериальной инфекции у субъекта, если вероятность превышает предварительно определенное пороговое значение.

В соответствии с одним аспектом некоторых вариантов осуществления настоящего изобретения предусмотрен способ анализа биологических данных, при этом биологические данные содержат значения экспрессии множества полипептидов в крови субъекта. Указанный способ включает: вычисление расстояния между сегментом кривой и осью, образованной направлением, при этом расстояние вычисляется в точке кривой, образованной координатой δ0 вдоль направления. Способ также включает определение корреляции расстояния с присутствием, отсутствием или вероятностью того, что субъект имеет вирусную инфекцию. Координата δ0 определяется на основе комбинации значений экспрессии, при этом, по меньшей мере, 90% сегмента заключено между нижней ограничивающей прямой g(δ0)-ε0 и верхней ограничивающей прямой g(δ0)+ε1, при этом f(δ0) равняется 1/(1+ехр(δ0)), и при этом каждый из ε0 и ε1 составляет менее 0,5.

В соответствии с некоторыми вариантами осуществления изобретения способ включает определение вероятности на основе расстояния, сравнение вероятности с предварительно определенным пороговым значением и лечение вирусной инфекции у субъекта, если вероятность превышает предварительно определенное пороговое значение.

В соответствии с некоторыми вариантами осуществления изобретения комбинация значений экспрессии включает линейную комбинацию значений экспрессии.

В соответствии с некоторыми вариантами осуществления изобретения комбинация значений экспрессии включает, по меньшей мере, один нелинейный член, соответствующий, по меньшей мере, одному из значений экспрессии.

В соответствии с одним аспектом некоторых вариантов осуществления настоящего изобретения предусмотрен способ анализа биологических данных, при этом биологические данные содержат значения экспрессии множества полипептидов в крови субъекта. Способ включает: вычисление первого расстояния между сегментом кривой поверхности и плоскостью, образованной первый направлением и вторым направлением. Первое расстояние вычисляют в точке на поверхности, образованной первой координатой δ0 вдоль первого направления и второй координатой δ1 вдоль второго направления. Способ также включает определение корреляции расстояния с присутствием, отсутствием или вероятностью того, что субъект имеет бактериальную инфекцию. Каждая из координат образована различной комбинацией значений экспрессии, при этом, по меньшей мере, 90% сегмента заключено между нижней ограничивающей поверхностью f(δ01)-ε0 и верхней ограничивающей поверхностью f(δ01)+ε1, при этом f(δ01) равняется exp(δ1)/(1+exp(δ0)+exp(δ1)), и при этом каждый из ε0 и ε1 составляет менее 0,5.

В соответствии с некоторыми вариантами осуществления изобретения, по меньшей мере, для одной из координат комбинация значений экспрессии включает линейную комбинацию значений экспрессии.

В соответствии с некоторыми вариантами осуществления изобретения, по меньшей мере, для одной из координат комбинация значений экспрессии включает, по меньшей мере, один нелинейный член, соответствующий, по меньшей мере, одному из значений экспрессии.

В соответствии с некоторыми вариантами осуществления изобретения способ включает определение вероятности на основе первого расстояния, сравнение вероятности с предварительно определенным пороговым значением и лечение бактериальной инфекции у субъекта, если вероятность превышает предварительно определенное пороговое значение.

В соответствии с некоторыми вариантами осуществления изобретения способ также включает вычисление второго расстояния между сегментом второй кривой поверхности и плоскостью; а также определение корреляции второго расстояния с присутствием, отсутствием или вероятностью того, что субъект имеет вирусную инфекцию. В соответствии с некоторыми вариантами осуществления изобретения, по меньшей мере, 90% сегмента второй поверхности заключено между второй нижней ограничивающей поверхностью g(δ01)-ε2 и второй верхней ограничивающей поверхностью g(δ01)+ε3, при этом g(δ01) равняется exp(δ0)/(1+exp(δ0)+exp(δ1)), и при этом каждый из ε2 и ε3 составляет менее 0,5.

В соответствии с некоторыми вариантами осуществления изобретения способ включает определение вероятности на основе второго расстояния, сравнение вероятности со вторым предварительно определенным пороговым значением и лечение вирусной инфекции у субъекта, если вероятность превышает второе предварительно определенное пороговое значение.

В соответствии с некоторыми вариантами осуществления изобретения способ включает вычисление вероятности того, что субъект имеет бактериальную инфекцию на основе расстояния, вычисление вероятности того, что субъект имеет вирусную инфекцию на основе второго расстояния, сравнение каждой вероятности с соответствующим предварительно определенным пороговым значением, и, если каждая из вероятностей составляет менее соответствующего предварительно определенного порогового значения, последующее заключение о том, что пациент вероятно имеет неинфекционное заболевание.

В соответствии с одним аспектом некоторых вариантов осуществления настоящего изобретения предусмотрен способ анализа биологических данных, при этом биологические данные содержат значения экспрессии множества полипептидов в крови субъекта. Способ включает: вычисление расстояния между сегментом кривой поверхности и плоскостью, образованной первым расстоянием и вторым расстоянием. Расстояние вычисляют в точке на поверхности, образованной первой координатой δ0 вдоль первого направления и второй координатой δ1 вдоль второго направления. Способ включает определение корреляции расстояния с присутствием, отсутствием или вероятностью того, что субъект имеет вирусную инфекцию; при этом каждая из координат образована различной комбинацией значений экспрессии, при этом, по меньшей мере, 90% сегмента заключено между нижней ограничивающей поверхностью g(δ01)-ε0 и верхней ограничивающей поверхностью g(δ01)+ε1, при этом g(δ01) равняется exp(δ0)/(1+exp(δ0)+exp(δ1)), и при этом каждый из ε0 и ε1 составляет менее 0,5.

В соответствии с некоторыми вариантами осуществления изобретения каждый из множества полипептидов выбран из группы, состоящей из CRP, IP-10, TRAIL, IL1ra, РСТ и SAA.

В соответствии с некоторыми вариантами осуществления изобретения множество полипептидов включает, по меньшей мере, три полипептида.

В соответствии с некоторыми вариантами осуществления изобретения множество полипептидов включает, по меньшей мере, три полипептида, выбранных из группы, состоящей из CRP, IP-10, TRAIL, IL1ra, РСТ и SAA.

В соответствии с некоторыми вариантами осуществления изобретения множество полипептидов включает, по меньшей мере, CRP и TRAIL.

В соответствии с некоторыми вариантами осуществления изобретения множество полипептидов включает, по меньшей мере, CRP, TRAIL и IP-10.

В соответствии с некоторыми вариантами осуществления изобретения способ включает генерирование выходных данных по вероятности, при этом выходные данные представлены в виде текста.

В соответствии с некоторыми вариантами осуществления изобретения способ включает генерирование выходных данных по вероятности, при этом выходные данные представлены графически.

В соответствии с некоторыми вариантами осуществления изобретения способ включает генерирование выходных данных по вероятности, при этом выходные данные представлены в значения цвета.

В соответствии с некоторыми вариантами осуществления изобретения образец крови представляет собой цельную кровь.

В соответствии с некоторыми вариантами осуществления изобретения образец крови представляет собой составную часть цельной крови.

В соответствии с некоторыми вариантами осуществления изобретения составная часть крови включает сыворотку или плазму.

В соответствии с некоторыми вариантами осуществления изобретения способ включает определение значений экспрессии, при этом, по меньшей мере, одно из значений экспрессии определяется с помощью электрофореза или иммунохимического анализа.

В соответствии с некоторыми вариантами осуществления изобретения иммунохимическое определение осуществляется с помощью проточной цитометрии, радиоиммуноанализа, иммунофлуоресценции или с помощью иммуносорбентного анализа с ферментной меткой.

В соответствии с некоторыми вариантами осуществления изобретения вычисление и определение корреляции осуществляется с помощью компьютера, который удален от субъекта.

В соответствии с некоторыми вариантами осуществления изобретения вычисление и определение корреляции осуществляется с помощью компьютера, который находится рядом с субъектом.

В соответствии с некоторыми вариантами осуществления изобретения вычисление и определение корреляции осуществляется с помощью облачного вычислительного ресурса в облачном вычислительном центре.

В соответствии с некоторыми вариантами осуществления изобретения значения экспрессии измеряют с помощью измерительной системы, выполняющей, по меньшей мере, один вид автоматизированного анализа, выбранный из группы, состоящей из автоматизированного анализа ELISA, автоматизированного иммуноанализа и автоматизированного функционального анализа, при этом способ включает получение указанных биологических данных от указанной измерительной системы.

В соответствии с некоторыми вариантами осуществления изобретения указанное получение осуществляется через интернет посредством сетевого интерфейса.

В соответствии с одним аспектом некоторых вариантов осуществления настоящего изобретения предусмотрен способ анализа биологических данных с применением компьютера. Способ включает: отображение на отображающем устройстве графического пользовательского интерфейса (GUI) с элементом управления для активации вычислений; получение значений экспрессии полипептидов в крови субъекта; автоматическое вычисление балла на основе значений экспрессии в ответ на активацию элемента управления пользователем; генерирование на GUI графической шкалы с первым концом, идентифицированным в качестве соответствующего вирусной инфекции у субъекта, и вторым концом, идентифицированным в качестве соответствующего бактериальной инфекции у субъекта; и генерирование отметки на шкале в области, соответствующей баллу.

В соответствии с некоторыми вариантами осуществления изобретения значения экспрессии получают путем соединения с внешним устройством, которое обеспечивает измерение значений экспрессии. В соответствии с некоторыми вариантами осуществления изобретения GUI включает элемент управления соединением, при этом соединение с внешним устройством осуществляется в ответ на активацию элемента управления соединением пользователем.

В соответствии с некоторыми вариантами осуществления изобретения GUI включает множество полей для ввода значений экспрессии, при этом значения экспрессии получают через поля для ввода.

В соответствии с некоторыми вариантами осуществления изобретения балл представляет собой вероятность того, что субъект имеет бактериальную инфекцию. В соответствии с некоторыми вариантами осуществления изобретения балл представляет собой вероятность того, что субъект имеет вирусную инфекцию.

В соответствии с одним аспектом некоторых вариантов осуществления настоящего изобретения предусмотрен компьютерный программный продукт, включающий машиночитаемый носитель данных, на котором хранятся программные инструкции, которые при чтении аппаратным обрабатывающим устройством заставляют аппаратное обрабатывающее устройство получать значения экспрессии множества полипептидов в крови субъекта, который имеет неизвестное заболевание, и выполнять способ как описано выше и необязательно как более подробно описано ниже.

В соответствии с одним аспектом некоторых вариантов осуществления настоящего изобретения предусмотрена система для анализа биологических данных. Система включает: пользовательский интерфейс, сконфигурированный для получения значений экспрессии множества полипептидов в крови субъекта, который имеет неизвестное заболевание; и аппаратное обрабатывающее устройство с машиночитаемым носителем данных, на котором хранится компьютерный программный продукт.

В соответствии с одним аспектом некоторых вариантов осуществления настоящего изобретения предусмотрена система для анализа биологических данных. Система включает: первую часть, сконфигурированную для измерения значений экспрессии множества полипептидов в крови субъекта, который имеет неизвестное заболевание; вторую часть, включающую аппаратное обрабатывающее устройство с машиночитаемым носителем данных, на котором хранится компьютерный программный продукт.

В соответствии некоторыми вариантами осуществления изобретения первая часть, вторая часть и дисплей смонтированы или интегрированы с корпусом карманного устройства.

В соответствии с одним аспектом некоторых вариантов осуществления настоящего изобретения предусмотрен способ анализа набора данных. Способ включает: (а) анализ набора данных, включающего группы для классификации на основе значений экспрессии множества полипептидов в крови субъекта, который имеет неизвестное заболевание, в образцах крови нескольких субъектов, при этом группы для классификации включают бактериальную инфекцию, вирусную инфекцию и невирусное небактериальное заболевание; и (b) анализ групп для классификации для получения, по меньшей мере, первой функции вероятностной классификации f(δ01), отражающей вероятность того, что конкретный субъект имеет бактериальную инфекцию, при этом первая функция для классификации представляет собой функцию первой координаты δ0 и второй координаты δ1, и при этом каждая из координат образована различной комбинацией значений экспрессии.

В соответствии с некоторыми вариантами осуществления изобретения способ также включает вычисление второй функции для классификации g(δ01), отражающей вероятность того, что конкретный субъект имеет вирусную инфекцию, при этом вторая функция для классификации также представляет собой функцию первой и второй координаты.

В соответствии с некоторыми вариантами осуществления изобретения способ включает вычисление третьей функции для классификации h(δ01), отражающей вероятность того, что конкретный субъект имеет невирусное небактериальное заболевание, при этом третья функция для классификации также представляет собой функцию первой и второй координаты.

В соответствии с некоторыми вариантами осуществления изобретения, по меньшей мере, для одной из координат комбинация значений экспрессии включает линейную комбинацию значений экспрессии.

В соответствии с некоторыми вариантами осуществления изобретения, по меньшей мере, для одной из координат комбинация значений экспрессии включает, по меньшей мере, один нелинейный член, соответствующий, по меньшей мере, одному из значений экспрессии.

В соответствии с некоторыми вариантами осуществления изобретения способ включает генерирование выходных аналитических данных.

В соответствии с некоторыми вариантами осуществления изобретения набор данных включает одну или несколько многомерных записей.

В соответствии с некоторыми вариантами осуществления изобретения предусмотрен способ, при котором каждая запись в наборе данных включает, по меньшей мере, один клинический параметр соответствующего субъекта.

В соответствии с некоторыми вариантами осуществления изобретения предусмотрен способ, при котором клинический параметр выбран из группы, состоящей из пола, возраста, температуры, времени с момента появления симптомов и веса.

В соответствии с некоторыми вариантами осуществления изобретения анализ включает машинное обучение.

В соответствии с некоторыми вариантами осуществления изобретения машинное обучение включает машинное обучение с учителем.

В соответствии с некоторыми вариантами осуществления изобретения машинное обучение включает, по меньшей мере, одну процедуру, выбранную из группы, состоящей из кластеризации, метода опорных векторов, линейного моделирования, анализа на основе k-ближайших соседей, обучения с применением дерева решений, процедуры на основе агрегирования моделей, нейронных сетей, вероятностной модели, графической модели, байесовской сети, логистической регрессии и обучения на основе ассоциативных правил.

В соответствии с некоторыми вариантами осуществления изобретения предусмотрен способ, при котором машинное обучение выбрано из группы, состоящей из метода опорных векторов, нейронных сетей и логистической регрессии.

В соответствии с некоторыми вариантами осуществления изобретения образец крови представляет собой цельную кровь.

В соответствии с некоторыми вариантами осуществления изобретения образец крови представляет собой составную часть цельной крови.

В соответствии с некоторыми вариантами осуществления изобретения составная часть крови включает сыворотку или плазму.

В соответствии с некоторыми вариантами осуществления изобретения значение экспрессии определяется с помощью электрофореза или иммунохимического анализа.

В соответствии с некоторыми вариантами осуществления изобретения иммунохимическое определение осуществляется с помощью проточной цитометрии, радиоиммуноанализа, иммунофлуоресценции или с помощью иммуносорбентного анализа с ферментной меткой.

В соответствии с одним аспектом некоторых вариантов осуществления настоящего изобретения предусмотрен способ предсказания прогноза заболевания. Способ включает измерение уровня белка TRAIL в сыворотке у субъекта с заболеванием, при этом если уровень TRAIL находится ниже предварительно определенного уровня, то прогноз является более негативным, чем у субъекта с заболеванием с уровнем белка TRAIL в сыворотке выше предварительно определенного уровня.

В соответствии с некоторыми вариантами осуществления изобретения предусмотрен способ, при котором заболевание представляет собой инфекционное заболевание.

В соответствии с некоторыми вариантами осуществления изобретения предусмотрен способ, при котором заболевание не является инфекционным заболеванием.

В соответствии с одним аспектом некоторых вариантов осуществления настоящего изобретения предусмотрен способ определения курса лечения для заболевания у субъекта. Способ включает измерение уровня белка TRAIL в сыворотке у субъекта, при этом если уровень TRAIL находится ниже предварительно определенного уровня, то субъекта подвергают последнему оставшемуся эффективным виду лечения.

В соответствии с некоторыми вариантами осуществления изобретения предварительно определенный уровень составляет менее 20 пг/мл.

В соответствии с одним аспектом некоторых вариантов осуществления настоящего изобретения предусмотрен способ определения типа инфекции у субъекта женского пола детородного возраста.

Способ включает сравнение уровня белка TRAIL в сыворотке у субъекта с предварительно определенным пороговым уровнем, при этом предварительно определенный пороговый уровень соответствует уровню белка TRAIL в сыворотке здорового субъекта женского пола детородного возраста, или группы здоровых субъектов женского пола детородного возраста, при этом разница между уровнем белка TRAIL в сыворотке и предварительно определенным уровнем указывает на тип инфекции.

В соответствии с одним аспектом некоторых вариантов осуществления настоящего изобретения предусмотрен способ определения типа инфекции у субъекта мужского пола детородного возраста.

Способ включает сравнение уровня белка TRAIL в сыворотке у субъекта с предварительно определенным пороговым уровнем, при этом предварительно определенный пороговый уровень соответствует уровню белка TRAIL в сыворотке здорового субъекта мужского пола детородного возраста, или группы здоровых субъектов мужского пола детородного возраста, при этом разница между уровнем белка TRAIL в сыворотке и предварительно определенным уровнем указывает на тип инфекции.

В соответствии с некоторыми вариантами осуществления изобретения если уровень белка TRAIL в сыворотке превышает предварительно определенный пороговый уровень, то тип инфекции является вирусным.

В соответствии с некоторыми вариантами осуществления изобретения когда уровень белка TRAIL в сыворотке превышает предварительно определенный пороговый уровень, то тип инфекции является небактериальным.

В соответствии с некоторыми вариантами осуществления изобретения когда уровень белка TRAIL в сыворотке находится ниже предварительно определенного порогового уровня, то тип инфекции является бактериальным.

В соответствии с некоторыми вариантами осуществления изобретения когда уровень белка TRAIL в сыворотке находится ниже предварительно определенного порогового уровня, то тип инфекции является невирусным.

Если не указано иное, все используемые здесь технические и научные термины имеют те же значения, какие обычно понимаются средним специалистом в области, к которой относится данное изобретение. Несмотря на то, что при реализации на практике или тестировании настоящего изобретения могут применяться любые способы и материалы, являющиеся аналогичными или эквивалентными тем, которые описаны здесь, примеры способов и/или материалов описаны далее. В случае конфликта приоритет принадлежит данному описанию, включая определения. Кроме того, материалы, способы и примеры являются лишь иллюстративными и не должны рассматриваться в качестве ограничивающих.

ОПИСАНИЕ ЧЕРТЕЖЕЙ

Некоторые варианты осуществления изобретения описаны здесь лишь в качестве примера со ссылкой на прилагаемые фигуры. В плане же фигур следует отметить, что конкретные иллюстрации приведены лишь в качестве примера и в целях иллюстративного описания вариантов осуществления изобретения. В этом отношении описание наряду с фигурами сделает очевидным специалистам в данной области то, как варианты осуществления изобретения могут быть реализованы на практике.

На фигурах:

Фиг. 1А-В. Схема исследования. (А) Общий вид схемы исследования, nБакт, nВирусн. и nКонтрол. означают количество бактериальных (включая смешанные бактериальные плюс вирусные совместные инфекции), вирусных и контрольных (без явного инфекционного заболевания) случаев, соответственно. (В) Обнаружение белков и процесс проверки.

Фиг. 2А-С. Белки TRAIL, IP-10 и CRP экспрессируются различным образом у пациентов с бактериальным, вирусным и неинфекционным заболеванием. Представлены диаграммы типа "ящик с усами" для TRAIL (A), IP- 10 (В) и CRP (С), полученные при измерении у Мажоритарной группы (n=765). Красная линия и окружность соответствуют групповой медиане и среднему значению, соответственно; показаны p-значения t-теста бактериальной против вирусной группы и инфекционной (бактериальной и вирусной) против неинфекционной группы (включая здоровых субъектов).

Фиг. 3А-В. Сравнение сигнатуры с лабораторными параметрами и белковыми биомаркерами для различения пациентов с бактериальным и вирусным заболеванием. (А) Эффективность клинических и лабораторных параметров, а также наиболее эффективная пара (ANC и % лимфоцитов), триплет (ANC, % лимфоцитов и Пульс), и квадруплеты (ANC, % лимфоцитов, Пульс, % моноцитов) параметров, значения которых были скомбинированы с применением логистической регрессии. Сравнения осуществляли в рамках Мажоритарной группы (пациенты с бактериальным и вирусным заболеванием, n=653), помимо пульса (определен у 292 пациентов с бактериальным заболеванием и 326 пациентов с вирусным заболеванием) и интенсивностью дыхания (определена у 292 пациентов с бактериальным заболеванием и 326 пациентов с вирусным заболеванием). Сигнатура демонстрировала значительно более высокую эффективность (Р<10-15), чем оптимальный квадруплет.(В) Сигнатура демонстрировала значительно более высокую эффективность (Р<10-8), чем биомаркеры с хорошо определенной ролью в плане реакции на инфекции. Для каждого из выбранных биомаркеров проводили анализ на подгруппе Мажоритарной группы (43≤n≤154 для каждого анализа, нерепрезентативная выборка, n зависели от силы сигнала). Планки погрешностей соответствуют 95% доверительному интервалу.

Фиг. 4. Эффективность сигнатуры является стабильной в различных подгруппах пациентов. Показана AUC сигнатуры в подгруппах Мажоритарной группы (пациенты с бактериальным заболеванием и пациенты с вирусным заболеванием). Квадратная площадь пропорциональна количеству пациентов, а планки погрешностей соответствуют 95% доверительному интервалу. При анализе патогенов каждый вирус сравнивали с бактериями, поражающими ту же физиологическую систему, показано в скобках. R-респираторные, S-системные, C-центральная нервная система, G-желудочно-кишечный тракт, U-мочевыводящая система, K-кожа. Представлены только патогены, детектированные более чем у 5 пациентов. См. критерии для деления на подгруппы в Таблице 1 в Примере 1.

Фиг. 5. Калибровочный график MLR модели. В верхней части пациенты были сгруппированы в виде групп по 10 человек на основе их прогнозируемых вероятностей наличия бактериальной инфекции (ось x) и подвергнуты сравнению с наблюдаемой долей случаев бактериальных инфекции во второй группе (ось y). Пунктирная линия представляет собой скользящее среднее (размеров 5 групп). В нижней части показано распределение по прогнозируемым вероятностям наличия бактериальной инфекции (красные столбцы) и вирусной инфекции (синие столбцы).

Фиг. 6А-В. Возрастное распределение пациентов с поставленным диагнозом. А. Все участники исследования (n=794); В. Только пациенты-дети (n=445).

Фиг. 7А-В. Распределение детектированных патогенов у пациентов с поставленным диагнозом (n=794). А. Распределение по детектированным патогенам на основе подгрупп патогенов; В. Распределение детектированных патогенов по штамму (присутствуют штаммы, детектированные более чем y>1% пациентов). Распределение соответствует % положительных случаев детектирования у пациентов с диагностированным инфекционным заболеванием.

Фиг. 8. Распределение по пораженным физиологическим системам у пациентов с диагностированным инфекционным заболеванием (n=673).

Фиг. 9А-В. Распределение по клиническим синдромам (все пациенты с поставленным диагнозом, n=794). А. Основные клинические синдромы; В. Отдельные клинические синдромы.

Фиг. 10. Распределение по максимальным значениям температуры тела (n=794).

Фиг. 11. Распределение по времени с момента появления симптомов (n=794). N/A - здоровые контроли или пациенты, для которых не были получены данные.

Фиг. 12А-В. Характеристика сопутствующих патологий у пациентов. А. Распределение по сопутствующим патологиям (все хронически больные пациенты, n=305); В. Распределение по постоянно принимаемым лекарственным средствам (все хронически больные пациенты, n=305). Следует отметить, что у некоторых пациентов присутствовали несколько хронических заболеваний, которые подвергались лечению несколькими постоянно принимаемыми лекарственными средствами.

Фиг. 13. Распределение по месту направления на исследование (пациенты с поставленным диагнозом, n=794).

Фиг. 14А-В. Экстраполированные значения PPV и NPV для сигнатуры в виде функции распространенности бактериальных инфекций, А. Единогласная группа (бактериальная инфекция, вирусная инфекция) (n=527), В. Мажоритарная группа (бактериальная инфекция, вирусная инфекция) (n=653).

Фиг. 15А-Е. Точечные диаграммы клинических параметров и лабораторных измерений у пациентов с бактериальном, вирусным и неинфекционным заболеванием (как указано) в Мажоритарной группе (бактериальное заболевание, вирусное заболевание, неинфекционное заболевание) (n=765). Красная линия и окружность соответствуют групповой медиане и среднему, соответственно. Показаны p-значения t-теста бактериальной против вирусной группы и инфекционной (бактериальной и вирусной) против неинфекционной группы (включая здоровых субъектов).

Фиг. 16А-В. Сравнение эффективности сигнатуры и РСТ с применением различных пороговых значений. А. Эффективность, определенная у 76 пациентов из Единогласной группы (бактериальное заболевание, вирусное заболевание); В. Эффективность, определенная у 101 пациентов из Мажоритарной группы (бактериальное заболевание, вирусное заболевание). Планки погрешности соответствуют 95% доверительному интервалу. Чувствительность сигнатуры и специфичность вычисляли после исключения 14% пациентов с промежуточной иммунной реакцией.

Фиг. 17А-В. Сравнение эффективности сигнатуры и CRP с применением различных пороговых значений. А. Эффективность, определенная у Единогласной группы (бактериальное заболевание, вирусное заболевание) (n=527); В. Эффективность, определенная у Мажоритарной группы (бактериальное заболевание, вирусное заболевание) (n=653). Планки погрешностей соответствуют 95% доверительному интервалу. Чувствительность сигнатуры и специфичность вычисляли после исключения 14% пациентов с промежуточной иммунной реакцией.

Фиг. 18А-Н. Точечные диаграммы уровней некоторых белковых биомаркеров (произвольные единицы) у пациентов с бактериальным и вирусным заболеванием. Красная линяя и окружность соответствуют групповой медиане и среднему, соответственно. Показаны p-значения t-теста бактериальной группы против вирусной группы.

Фиг. 19А-В. Клиническая точность сигнатуры является устойчивой при сравнении со снижением технической эффективности измерений на основе белков. (A) AUC сигнатуры, обеспечивающей различение бактериальной и вирусной инфекции, оценивали с применением карты цветов в качестве функции измерения CV (станд./средн.) TRAIL (ось у) и CRP (ось х). (В) Значения AUC присутствуют на диагонали Фиг. 19А, таким образом что CV TRAIL и CRP являются равными.

ФИГ. 20 представляет собой 3-мерную визуализацию пациентов с бактериальным ('+'), вирусным ('о') и неинфекционным ('^') заболеванием. Указаны различные типы пациентов для различения отдельных участков на карте концентрации CRP (мкг/мл), TRAIL и IP-10 (пг/мл).

Фиг. 21А-С. Вероятность вирусного заболевания (А), бактериального или смешанного заболевания (В), и неинфекционного заболевания или здорового субъекта (С) в виде функции концентраций TRAIL (ось у), CRP (ось х) и IP-10, определенная в соответствии с некоторыми вариантами осуществления настоящего изобретения для IP-10 в диапазоне от 0 до 100.

Фиг. 22А-С. Вероятность вирусного заболевания (А), бактериального или смешанного заболевания (В), и неинфекционного заболевания или здорового субъекта (С) в виде функции концентраций TRAIL (ось у), CRP (ось х) и IP-10, определенная в соответствии с некоторыми вариантами осуществления настоящего изобретения для IP-10 в диапазоне от 100 до 200.

Фиг. 23А-С. Вероятность вирусного заболевания (А), бактериального или смешанного заболевания (В), и неинфекционного заболевания или здорового субъекта (С) в виде функции концентраций TRAIL (ось у), CRP (ось х) и IP-10, определенная в соответствии с некоторыми вариантами осуществления настоящего изобретения для IP-10 в диапазоне от 200 до 300.

Фиг. 24А-С. Вероятность вирусного заболевания (А), бактериального или смешанного заболевания (В), и неинфекционного заболевания или здорового субъекта (С) в виде функции концентраций TRAIL (ось у), CRP (ось х) и IP-10, определенная в соответствии с некоторыми вариантами осуществления настоящего изобретения для IP-10 в диапазоне от 300 до 400.

Фиг. 25А-С. Вероятность вирусного заболевания (А), бактериального или смешанного заболевания (В), и неинфекционного заболевания или здорового субъекта (С) в виде функции концентраций TRAIL (ось у), CRP (ось х) и IP-10, определенная в соответствии с некоторыми вариантами осуществления настоящего изобретения для IP-10 в диапазоне от 400 до 500.

Фиг. 26А-С. Вероятность вирусного заболевания (А), бактериального или смешанного заболевания (В), и неинфекционного заболевания или здорового субъекта (С) в виде функции концентраций TRAIL (ось у), CRP (ось х) и IP-10, определенная в соответствии с некоторыми вариантами осуществления настоящего изобретения для IP-10 в диапазоне от 500 до 1000.

Фиг. 27А-С. Вероятность вирусного заболевания (А), бактериального или смешанного заболевания (В), и неинфекционного заболевания или здорового субъекта (С) в виде функции концентраций TRAIL (ось у), CRP (ось х) и IP-10, определенная в соответствии с некоторыми вариантами осуществления настоящего изобретения для IP-10 в диапазоне от 1000 до 2000.

Фиг. 28А-С. Вероятность вирусного заболевания (А), бактериального или смешанного заболевания (В), и неинфекционного заболевания или здорового субъекта (С) в виде функции концентраций TRAIL (ось у), CRP (ось х) и IP-10, определенная в соответствии с некоторыми вариантами осуществления настоящего изобретения для IP-10 в диапазоне от 2000 и более.

Ha Фиг. 29A-F приведены иллюстративные примеры выходных данных в соответствии со способом различения бактериальной и небактериальной инфекции в соответствии с вариантом осуществления настоящего изобретения.

Фиг. 30А-В представляют собой графики, иллюстрирующие корреляцию между быстрым и медленным протоколом измерения TRAIL (Фиг. 30А) и IP-10 (Фиг. 30В).

Фиг. 31 представляет собой блок-схему способа, являющегося подходящим для анализа биологических данных, полученных от субъекта, в соответствии с различными примерами вариантов осуществления настоящего изобретения.

Фиг. 32А-В представляют собой схематические иллюстрации, описывающие процедуру вычисления расстояния между поверхностью и плоскостью в соответствии с некоторыми вариантами осуществления настоящего изобретения.

Фиг. 33А-D представляют собой схематически иллюстрации, описывающие процедуру получения сглаженного варианта сегмента поверхности в соответствии с некоторыми вариантами осуществления настоящего изобретения.

Фиг. 34 представляет собой схематическую иллюстрацию блочной диаграммы системы для анализа биологических данных в соответствии с некоторыми вариантами осуществления настоящего изобретения.

Фиг. 35А-D представляют собой контурные диаграммы, описывающие вероятность наличия заболевания бактериальной (Фиг. 35А), вирусной (Фиг. 35В), небактериальной (Фиг. 35С) и неинфекционной (Фиг. 35В) этиологии в виде функции координат δ0 и δ1. Значения вероятности лежат в диапазоне от 0% (черные) до 100% (белые).

Фиг. 36А-В. Низкие уровни TRAIL свидетельствуют о негативном прогнозе для пациента и исходе, а также о высокой степени тяжести заболевания. (А) Концентрации TRAIL в сыворотке пациентов, которые соответствовали критериям поступления в отделение интенсивной терапии по сравнению со всеми другими пациентами (с заболеванием инфекционной или неинфекционной этиологии). (В) Концентрации TRAIL в сыворотке пациентов-детей, которые соответствовали критериям поступления в отделение интенсивной терапии или умерли по сравнению со всеми другими пациентами с заболеванием инфекционной или неинфекционной этиологии.

Фиг. 37А-В представляют собой графики, иллюстрирующие разницу между концентрацией TRAIL у мужчин и женщин детородного возраста.

Фиг. 38А-Е представляют собой скриншоты графического пользовательского интерфейса (GUI), являющегося подходящим для введения пользователем данным в рамках способа с применением компьютера для анализа биологических данных в соответствии с некоторыми вариантами осуществления настоящего изобретения.

Фиг. 39А и 39В представляют собой схематические иллюстрации блочной диаграммы системы для анализа биологических данных в рамках вариантов осуществления изобретения, при которых система включает сетевой интерфейс (Фиг. 39А) и пользовательский интерфейс (Фиг. 39В).

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

Настоящее изобретение в рамках некоторых вариантов его осуществления относится к вычислительному анализу и, более конкретно, но не исключительно, к вычислительному анализу биологических данных, например с целью обеспечения различения бактериальной инфекции и небактериального заболевания, и/или бактериальной инфекции и вирусной инфекции, и/или инфекционного и неинфекционного заболевания.

Перед подробным описанием, по меньшей мере, одного варианта осуществления изобретения следует отметить, что изобретение не является ограниченным в плане его применимости сведениями, которые приведены ниже в данном описании или которые приведены в качестве примеров в разделе Примеры. Изобретение может быть реализовано в рамках других вариантов осуществления или может быть практически осуществлено или выполнено иными способами.

Различные инфекционные агенты обладают уникальными молекулярными паттернами, которые могут быть идентифицированы иммунной системой и являться ее мишенями. Патоген-ассоциированные молекулярные паттерны (РАМР) представляют собой пример подобных молекул, которые связаны с различными группами патогенов и могут быть распознаны клетками врожденной иммунной системы с применением Toll-подобных рецепторов (TLR) и других рецепторов распознавания паттернов (например, NOD белками).

Данные рецепторы могут значительно отличаться в рамках различных классов патогенов и, таким образом, вызывать различные иммунные реакции. Например, TLR-4 может распознавать липополисахарид, являющийся компонентом грамотрицательных бактерий, а также липотейхоевые кислоты, являющиеся компонентом грамположительных бактерий, таким образом стимулируя противомикробную реакцию иммунной системы. TLR-3 может распознавать одноцепочечную РНК (часто являющуюся признаком наличия вирусной инфекции) и, таким образом, стимулировать подходящую противовирусную реакцию. Благодаря различению различных классов патогенов (например бактериальных и вирусных) иммунная система может задействовать подходящую защиту.

В течение нескольких последних десятилетий были идентифицированы несколько маркеров организма, которые могут применяться для обеспечения дифференциальной диагностики источника инфекции при различных проявлениях. Путем измерения маркеров, полученных от организма, а не от патогена, является возможным минимизировать "ложноположительные" диагнозы вследствие непатологических штаммов бактерий, которые являются частью естественной флоры организма. Один из примеров представляет собой Прокальцитонин (РСТ), являющийся прекурсором гормона кальцитонина, продуцируемого С-клетками щитовидной железы. Уровни РСТ в кровотоке здоровых субъектов являются сложно детектируемыми (в пг/мл диапазоне), однако они могут значительно повышаться в результате тяжелой инфекции, при этом уровни могут подниматься вплоть до 100 нг/мл. РСТ широко применяется для постановки диагноза у пациентов с системной инфекцией, то есть сепсисом, при этом чувствительность составляет 76%, а специфичность составляет 70%. Тем не менее, исследования, в рамках которых анализировали диагностическую ценность РСТ при другой несистемной инфекции, такой как пневмония или инфекции верхних дыхательных путей, показали, что она является ограниченной, особенно при самостоятельном применении.

Авторы ранее определили новые наборы биомаркеров, паттерн экспрессии которых значительно коррелирует с типом инфекции - как описано в Международной патентной заявке WO 2011132086 и WO 2013/117746, обе из которых приведены здесь для ссылки.

Настоящее изобретение в рамках некоторых вариантов его осуществления основано на применении сигнатуры полипептидов для диагностики бактериальных инфекций, вирусных инфекций и небактериальных невирусных заболеваний. Способы по вариантам осуществления настоящего изобретения включают применение алгоритмов распознавания паттернов для идентификации типа инфекции, которой страдает субъект, что в свою очередь обеспечивает возможность выбора подходящей схемы лечения. Различные варианты осуществления изобретения направлены на преодоление ограничений современных диагностических решений за счет: (i) обеспечения возможности проведения точной диагностики в рамках широкого диапазона патогенов; (ii) обеспечения быстрой диагностики (в течение нескольких минут); (iii) нечувствительности к наличию непатогенных бактерий и вирусов (таким образом обеспечивая снижение проблемы ложноположительных результатов); и (iv) устранения потребности в прямом заборе образцов патогена, таким образом обеспечивая диагностику недоступных инфекций. Таким образом, некоторые способы по изобретению обеспечивают возможность отбора субъектов, для которых лечение антибиотиками является желательным, и предотвращение нежелательного лечения антибиотиками у субъектов, имеющих только вирусную инфекцию или неинфекционное заболевание. Некоторые способы по изобретению также предусматривают отбор субъектов, для которых противовирусное лечение будет обладать являться благоприятным.

Для подкрепления результатов, приведенных в Международной патентной заявке WO 2013/117746, авторы настоящего изобретения в данном случае увеличили количество пациентов, принимавших участие в многоцентровом клиническом исследовании, включив в него 1002 пациентов больниц с различными типами подтвержденных инфекций, а также контрольных субъектов (пациентов с подтвержденным невирусным/небактериальным заболеванием и здоровых субъектов).

Пытаясь повысить уровень точности и чувствительности описанных ранее способов, авторы настоящего изобретения в данном случае применили троичный классификатор, который обеспечивает классификацию пациентов (с подтвержденным типом заболевания) на три различных класса: бактериальная инфекция, вирусная инфекция и небактериальное невирусное заболевание. Сравнение уровней комбинации полипеитидов у тестируемого субъекта с паттернами экспрессии, полученными в рамках исследования, приводило к получению лучших результатов в плане чувствительности и специфичности по сравнению с двоичным классификатором, как показано в Примере 3 и в Таблицах 9-12.

В контексте настоящего изобретения могут применяться следующие аббревиатуры. ANC = Абсолютное количество нейтрофилов; ANN = Искусственные нейронные сети; AUC = Площадь под характеристической кривой; BP = Bordetella pertussis; CHF = Хроническая сердечная недостаточность; CI = Доверительный интервал; CID = Врожденный иммунодефицит; CLL = Хронический лимфолейкоз; CMV = Цитомегаловирус; CNS = Центральная нервная система; COPD = Хроническая обструктивная болезнь легких; CP = Chlamydophila pneumoniae; CRP = С-реактивный белок; CSF = Спинномозговая жидкость; CV = Коэффициент вариации; DOR = Соотношение диагностических коэффициентов; EBV = Вирус Эпштейна-Барра; eCRF = Электронная форма отчета; ED = Отделение неотложной помощи; ELISA = Иммуносорбентный анализ с ферментной меткой; FDR = Частота ложноположительных обнаружений; FMF = Семейная средиземноморская лихорадка; G-CSF = Гранулоцитарный колониестимулирующий фактор; GM-CSF = Гранулоцитарно-макрофагальный колониестимулирующий фактор; HBV = Вирус гепатита В; HCV = Вирус гепатита С; HI = Haemophilus influenza; HIV = Вирус иммунодефицита человека; IDE = Эксперты по инфекционным болезням; IL = Интерлейкин; IRB = Институциональный наблюдательный совет; IVIG = Внутривенный иммуноглобулин; KNN = Анализ на основе k-ближайших соседей; LP = Legionella pneumophila; LR+ = Положительный критерий отношения правдоподобия; LR- = Отрицательный критерий отношения правдоподобия; LRTI = Инфекции нижних дыхательных путей; mAb = Моноклональные антитела; MDD = Минимальная детектируемая доза; MDS = Миелодиспластический синдром; MP = Микоплазменная пневмония; MPD = Миелопролиферативное заболевание; NPV = Отрицательная прогностическая ценность; РСТ = Прокальцитонин; PED = Детское отделение неотложной помощи; PPV = Положительная прогностическая ценность; QA = Гарантия качества; RSV = Респираторно-синцитиальный вирус; RV = Риновирус; SIRS = Системный воспалительный синдром; SP = Стрептококковая пневмония; STARD = Стандарты отчетности по диагностической точности; SVM = Метод опорных векторов; TNF = Фактор некроза опухоли; URTI = Инфекция верхних дыхательных путей; UTI = Инфекции мочевыводящих путей; WBC = Белая кровяная клетка; WS = Критерий Уилкоксона.

В контексте настоящего изобретения могут применяться следующие статистические термины.

"TP" представляет собой истинно положительный результат и означает положительный результат теста, который точно отражает тестируемую активность. Например, в контексте настоящего изобретения TP, например, но без ограничения, истинным образом классифицирует бактериальную инфекцию как таковую.

"TN" представляет собой истинно отрицательный результат и означает отрицательный результат теста, который точно отражает тестируемую активность. Например, в контексте настоящего изобретения TN, например, но без ограничения, истинным образом классифицирует вирусную инфекцию как таковую.

"FN" представляет собой ложноотрицательный результат и означает результат, который выглядит отрицательным, но не описывает ситуацию. Например, в контексте настоящего изобретения FN, например, но без ограничения, ложным образом классифицирует бактериальную инфекцию как таковую.

"FP" представляет собой ложноположительный результат и означает результат теста, который ошибочно классифицируется в качестве соответствующего положительной категории. Например, в контексте настоящего изобретения FP, например, но без ограничения, ложным образом классифицирует бактериальную инфекцию в качестве бактериальной инфекции.

"Чувствительность" вычисляют как TP/(TP+FN) или на основе истинно положительной доли субъектов с заболеванием.

"Специфичность" вычисляют как TN/(TN+FP) или на основе истинно отрицательной доли случаев отсутствия заболевания или нормальных субъектов.

"Общую точность" вычисляют как (TN+TP)/(TN+FP+ТР+FN).

"Положительную прогностическую ценность" или "PPV" вычисляют как TP/(TP+FP) или в виде истинно положительной доли всех положительных результатов тестирования. На него по существу влияют частотность заболевания и вероятность его возникновения в тестируемой популяции перед проведением теста.

"Отрицательную прогностическую ценность" или "NPV" вычисляют как TN/(TN+FN) или на основе истинно отрицательной доли всех отрицательных результатов тестирования. На нее также по существу влияют частотность заболевания и вероятность его возникновения в тестируемой популяции перед проведением теста. См., например, O'Marcaigh AS, Jacobson RM, "Estimating The Predictive Value Of A Diagnostic Test, How To Prevent Misleading Or Confusing Results," Clin. Ped. 1993, 32(8): 485-491, где обсуждается специфичность, чувствительность и положительная и отрицательная прогностическая ценность теста, например клинического диагностического текста.

"МСС" (Коэффициент корреляции Мэтьюса) вычисляют следующим образом: МСС=(TP* TN-FP*FN)/((TP+FN)*(TP+FP)*(TN+FP)*(TN+FN}^O,5,

где TP, FP, TN, FN представляют собой истинно положительные, ложноположительные, истинно отрицательные и ложноотрицательные результаты, соответственно. Следует обратить внимание, что значения МСС лежат в диапазоне между -1 и +1, что соответствует полностью неправильной и превосходной классификации, соответственно. Нулевое значение МСС указывает на произвольную классификацию. Было показано, что МСС может применяться для комбинирования чувствительности и специфичности в одну метрику (Baldi, Brunak et al. 2000). Он также может применяться для измерения и оптимизации точности классификации в случаях несбалансированных размеров классов (Baldi, Brunak et al. 2000).

Термин "точность" означает степень соответствия измеренного или вычисленного количества (полученного в рамках теста значения) с его реальным (или истинным) значением. Клиническая точность относится к доле истинных результатов (истинно положительных (TP) или истинно отрицательных (TN) относительно неправильно классифицированных результатов (ложноположительных (FP) или ложноотрицательных (FN)) и может быть выражена как чувствительность, специфичность, значения положительной прогностической ценности (PPV) или отрицательной прогностической ценности (NPV), Коэффициент корреляции Мэтьюса (МСС) или в виде вероятности, соотношения вероятностей, характеристической кривой обнаружения (ROC), площади под кривой (AUC), а также других показателей.

Термин "аналитическая точность" означает воспроизводимость и предсказуемость самого процесса измерения и может быть обобщен в рамках подобных измерений в виде коэффициентов вариации (CV), коэффициента корреляции Пирсона и тестов на соответствие и калибровку нескольких образцов или контролей с различными показателями времени, пользователями, оборудованием и/или реагентами. Данные и иные обстоятельства в рамках оценки новых биомаркеров также приведены у Vasan, 2006.

"Эффективность" представляет собой термин, который связан с общей полезностью и качеством диагностического или прогностического теста, включая, помимо прочего, клиническую и аналитическую эффективность, другие аналитические и процессные характеристики, такие как применение характеристик (например, стабильности, простоты применения), экономического показателя здоровья, и относительных затрат на компоненты теста. Любой из данных факторов может являться источником повышенной эффективности и, таким образом, полезности теста и может быть определен с помощью подходящих "метрик эффективности", таких как AUC и МСС, время до получения результата, срок хранения и так далее в качестве соответствующего данному критерию..

Под "статистически значимым" подразумевается, что соответствующее изменение является более существенным, чем то, которое произойти лишь случайным образом (которое могло являться "ложноположительным").

Статистическая значимость может быть определена с помощью любого способа, известного из уровня техники. Обычно применяемые способы измерения значимости включают p-значение, которое описывает вероятность получения результата, который, по меньшей мере, является столь же экстремальным, что и соответствующие данные при условии, что эти данные являлись результатом только случайности. Результат зачастую считают высокозначимым при p-значении =0,05 или менее.

Далее будут подробны описаны аспекты изобретения.

Фиг. 31 представляет собой блок-схему способа, являющегося подходящим для анализа биологических данных, полученных от субъекта, в соответствии с различными примерами вариантов осуществления настоящего изобретения. Следует понимать, что если не указано иное, описанные ниже операции могут быть осуществлены либо одновременно, либо последовательно в рамках множества комбинаций или последовательностей осуществления. В частности, приведенный на блок-схемах порядок осуществления не следует рассматривать в качестве ограничивающего. Например, две или более операции, которые приведены в рамках последующего описания или на блок-схемах в определенном порядке, могут быть осуществлены в ином порядке (например, в обратном порядке) или по существу одновременно. Дополнительно, некоторые описанные ниже операции являются необязательными и могут не осуществляться.

В некоторых вариантах осуществления настоящего изобретения субъект ранее подвергался лечению антибиотиком, при этом в некоторых вариантах осуществления настоящего изобретения субъекты ранее не подвергался лечению антибиотиком.

Любой из описанных здесь способов может быть практически реализован в различных формах. Например, он может быть реализован в рамках физического носителя, например в виде компьютера для выполнения операций, являющихся частью способа. Он может быть реализован в рамках машиночитаемого носителя данных, включающего машиночитаемые инструкции для реализации операций, являющихся частью способа. Он также может быть реализован в рамках электронного устройства, имеющего характеристики цифрового компьютера, являющегося подходящим для выполнения компьютерной программы в рамках физического носителя, или выполнять инструкции на машиночитаемом носителе данных.

Компьютерные программы, в рамках которых осуществляется практическая реализация способа в соответствии с настоящими вариантами осуществления изобретения, могут поставляться пользователям на дистрибуционном носителе, таком как, но без ограничения, CD-ROM или флэш-накопитель. Компьютерные программы могут быть скопированы с дистрибуционного носителя на жесткий диск или малый промежуточный носитель данных. В некоторых вариантах осуществления настоящего изобретения компьютерные программы, в рамках которых осуществляется практическая реализация способа в соответствии с настоящими вариантами осуществления изобретения, могут быть поставлены пользователям путем обеспечения возможности скачивания пользователями программ из удаленного месторасположения через коммуникационную сеть, например интернет. Компьютерные программы могут быть запущены путем загрузки компьютерных инструкций либо с их дистрибуционного носителя или их промежуточного носителя данных в выполняемую память компьютера, конфигурирования компьютера для работы в соответствии со способом по данному изобретению. Все данные операции хорошо известны специалистам в области компьютерных систем.

Вычислительные операции в рамках способа в соответствии с настоящими вариантами осуществления изобретения могут быть выполнены компьютером, являющимся либо удаленным, либо находящимся рядом с субъектом. В случае, если компьютер является удаленным относительно пользователя, он может получать данные через сеть, такую как телефонная сеть или интернет. С этой целью локальный компьютер может применяться для передачи данных удаленному компьютеру. Данная конфигурация обеспечивает выполнение анализа, когда субъект находится в ином месте (например, дома), и также обеспечивает выполнение одновременных анализов для нескольких субъектов, находящихся во множестве различных мест.

Вычислительные операции в рамках способа также могут осуществляться с помощью облачного вычислительного ресурса в облачном вычислительном центре. Облачный вычислительный ресурс может включать вычислительный сервер и необязательно также сервер для хранения данных, и может управляться облачным вычислительным клиентом, как известно из уровня техники.

Способ в соответствии с некоторыми вариантами осуществления может применяться для "вынесения заключения" о наличии бактериальной инфекции. Альтернативно, способ также может применяться для "вынесения заключения" об отсутствии небактериальной инфекции. Способ в соответствии с некоторыми вариантами осуществления может применяться для "вынесения заключения" об отсутствии бактериальной инфекции и "вынесении заключения" о наличии небактериального заболевания.

Способ в соответствии с некоторыми вариантами осуществления может применяться для "вынесения заключения" о наличии вирусной инфекции. Альтернативно, способ также может применяться для "вынесения заключения" об отсутствии невирусной инфекции.

Способ в соответствии с некоторыми вариантами осуществления может применяться для "вынесения заключения" об отсутствии вирусной инфекции и для "вынесения заключения" о наличии невирусного заболевания.

Способ в соответствии с некоторыми вариантами осуществления может применяться для "вынесения заключения" о наличии неинфекционного заболевания. Альтернативно, способ может применяться для "вынесения заключения" об отсутствии неинфекционного заболевания. Способ в соответствии с некоторыми вариантами осуществления может применяться для "вынесения заключения" об отсутствии инфекционного заболевания и "вынесении заключения" о наличии неинфекционного заболевания.

Биологические данные, анализируемые с помощью способа, содержат значения экспрессии множества полипептидов в крови субъекта. В некоторых вариантах осуществления биологические данные включают значения экспрессии лишь двух полипептидов, в некоторых вариантах осуществления биологические данные включают значения экспрессии, по меньшей мере, трех полипептидов, в некоторых вариантах осуществления биологические данные включают значения экспрессии лишь трех полипептидов, в некоторых вариантах осуществления биологические данные включают значения экспрессии, по меньшей мере, четырех полипептидов, в некоторых вариантах осуществления биологические данные включают значения экспрессии лишь четырех полипептидов, в некоторых вариантах осуществления биологические данные включают значения экспрессии, по меньшей мере, пяти полипептидов, и в некоторых вариантах осуществления биологические данные включают значения экспрессии лишь пяти полипептидов.

Авторы настоящего изобретения рассматривают многие типы полипептидов. Соответствующие примеры включают, без ограничения, CRP, IP- 10, TRAIL, IL1ra, РСТ и SAA. В некоторых вариантах осуществления данное множество полипептидов включает, по меньшей мере, CRP и TRAIL, и в некоторых вариантах осуществления данное множество полипептидов включает, по меньшей мере, CRP, TRAIL и IP-10.

В некоторых вариантах осуществления настоящего изобретения биологические данные представлены в форме субъект-специфического набора данных, как далее подробно описано ниже.

В соответствии с определенным вариантом осуществления уровни секретируемых (то есть растворимых) полипептидов (например, TRAIL, CRP и IP-10) подвергают анализу с помощью данного способа.

Термин "субъект" в соответствии с используемым здесь значением предпочтительно означает человека. Субъект может иметь мужской или женский пол. Субъект может представлять собой новорожденного, ребенка, подростка или взрослого. Субъект может являться тем, кому ранее был поставлен диагноз или кто был идентифицирован в качестве имеющего инфекцию, и необязательно уже подвергся или подвергается терапевтическому вмешательству для лечения инфекции. Альтернативно, субъект также может являться тем, кому не был ранее поставлен диагноз, связанный с наличием инфекции. Например, субъект может представлять собой того, кто демонстрирует один или несколько факторов риска, связанных с наличием инфекции. Субъект также может иметь инфекции, но не демонстрировать симптомов инфекции.

Субъект, заболевание которого было диагностировано в соответствии с некоторыми вариантами осуществления настоящего изобретения обозначается ниже как "тестируемый субъект". Авторы настоящего изобретения собрали информацию относительно паттернов экспрессии полипептидов у множества субъектов, чье заболевание было уже диагностировано, и разработали аналитический способ в соответствии с настоящими вариантами осуществления изобретения на основе собранной информации. Данное множество субъектов обозначено ниже как "субъекты перед диагностикой" или "другие субъекты".

В соответствии с используемым здесь значением, термин "бактериальная инфекция" означает состояние, при котором субъект является инфицированным бактерией. Инфекция может являться симптоматической или асимптоматической. В контексте данного изобретения бактериальная инфекция также может включать вирусный компонент (то есть являться смешанной инфекцией вследствие как бактерий, так и вируса).

Бактериальная инфекция может являться острой или хронической.

Острая инфекция характеризуется быстрым развитием заболевания, относительно быстрым периодом проявления симптомов и разрешением в течение нескольких дней. Хроническая инфекция представляет собой инфекцию, которая развивается медленно и длится в течение долгого времени. Одно различие между острой и хронической инфекцией заключается в том, что при острой инфекции иммунная система зачастую продуцирует IgM+ антитела против инфекционного агента, в то время как хроническая фаза инфекции обычно характеризуется IgM-/IgG+ антителами. Кроме того, острые инфекции вызывают опосредуемые иммунитетом некротические процессы, в то время как хронические инфекции зачастую вызывают опосредуемые воспалением фиброзные процессы и появление шрамов. Таким образом, острые и хронические инфекции могут затрагивать различные иммунологические механизмы более низкого порядка.

Бактериальная инфекция может являться результатом грамположительных, грамотрицательных бактерий или атипичных бактерий.

Термин "грамположительные бактерии" в соответствии с используемым здесь значением означает бактерии, характеризуемые тем, что частью структуры их клеточной оболочки является пептидогликан, а также полисахариды и/или тейхоевые кислоты, а также характеризуются сине-фиолетовым цветом их реакции при процедуре окрашивания по Граму. Соответствующе грамположительные бактерии включают: Actinomyces spp., Bacillus anthracis, Bifidobacterium spp., Clostridium botulinum, Clostridium perfringens, Clostridium spp., Clostridium tetani, Corynebacterium diphtheriae, Corynebacterium jeikeium, Enterococcus faecalis, Enterococcus faecium, Erysipelothrix rhusiopathiae, Eubacterium spp., Gardnerella vaginalis, Gemella morbillorum, Leuconostoc spp., Mycobacterium abcessus, комплекс Mycobacterium avium, Mycobacterium chelonae, Mycobacterium fortuitum, Mycobacterium haemophilium, Mycobacterium kansasii, Mycobacterium leprae, Mycobacterium marinum, Mycobacterium scrofulaceum, Mycobacterium smegmatis, Mycobacterium terrae, Mycobacterium tuberculosis, Mycobacterium ulcerans, Nocardia spp., Peptococcus niger, Peptostreptococcus spp., Proprionibacterium spp., Staphylococcus aureus, Staphylococcus auricularis, Staphylococcus capitis, Staphylococcus cohnii, Staphylococcus epidermidis, Staphylococcus haemolyticus, Staphylococcus hominis, Staphylococcus lugdanensis, Staphylococcus saccharolyticus, Staphylococcus saprophyticus, Staphylococcus schleiferi, Staphylococcus similans, Staphylococcus warneri, Staphylococcus xylosus, Streptococcus agalactiae (стрептококк группы В), Streptococcus anginosus, Streptococcus bovis, Streptococcus canis, Streptococcus equi, Streptococcus milleri, Streptococcus mitior, мутанты Sreptococcus, Streptococcus pneumoniae, Streptococcus pyogenes (стрептококк группы A), Streptococcus salivarius, Streptococcus sanguis.

Термин "грамотрицательные бактерии" в соответствии с используемым здесь значением означает бактерии, характеризуемые наличием двойной мембраны, окружающей каждую бактериальную клетку.

Соответствующие грамотрицательные бактерии включают Acinetobacter calcoaceticus, Actinobacillus actinomycetemcomitans, Aeromonas hydrophila, Alcaligenes xylosoxidans, бактероиды, Bacteroides fragilis, Bartonella bacilliformis, Bordetella spp., Borrelia burgdorferi, Branhamella catarrhalis, Brucella spp., Campylobacter spp., Chalmydia pneumoniae, Chlamydia psittaci, Chlamydia trachomatis, Chromobacterium violaceum, Citrobacter spp., Eikenella corrodens, Enterobacter aerogenes, Escherichia coli, Flavobacterium meningosepticum, Fusobacterium spp., Haemophilus influenzae, Haemophilus spp., Helicobacter pylori, Klebsiella spp., Legionella spp., Leptospira spp., Moraxella catarrhalis, Morganella morganii, Mycoplasma pneumoniae, Neisseria gonorrhoeae, Neisseria meningitidis, Pasteurella multocida, Plesiomonas shigelloides, Prevotella spp., Proteus spp., Providencia rettgeri, Pseudomonas aeruginosa, Pseudomonas spp., Rickettsia prowazekii, Rickettsia rickettsii, Rochalimaea spp.. Salmonella spp., Salmonella typhi, Serratia marcescens, Shigella spp., Treponema carateum, Treponema pallidum, Treponema pallidum endemicum, Treponema pertenue, Veillonella spp., Vibrio cholerae, Vibrio vulnificus, Yersinia enterocolitica и Yersinia pestis.

Термин "атипичные бактерии" означает бактерии, которые не относятся ни к одной из классических групп по Граму. Как правило, они представляют собой внутриклеточные бактериальные патогены. Они включают, без ограничения, Mycoplasmas spp., Legionella spp. Rickettsiae spp. и Chlamydiae spp.

Термин "небактериальное заболевание" в соответствии с используемым здесь значением означает любое заболевание или состояние, которое не вызывается инфекционными бактериями.

На Фиг. 31 способ начинается в пункте 310 и продолжается в пункте 311, в котором вычисляется первое расстояние d между сегментом SROI первого кривого объекта S и некривого объекта π. В целом, первый кривой объект S представляет собой многообразие в n измерениях, при этом n представляет собой положительное целое число, а некривой объект π представляет собой гиперплоскость в n+1-мерном пространстве.

Концепция n-мерных многообразий и гиперплоскостей в n+1 измерениях хорошо известна специалистам в области геометрии. Например, если n=1, то первый кривой объект представляет собой кривую линию, а второй некривой объект π представляет собой гиперплоскость в 2 измерениях, а именно прямую линию, образующую ось. Если n=2, то первый кривой объект представляет собой кривую поверхность, в некривой объект π представляет собой гиперплоскость в 3 измерениях, а именно плоскую плоскость, называемую ниже "плоскостью".

Гиперплоскость π образована n направлениями. Например, если некривой объект представляет собой ось, то он образован одним направлением, а если некривой объект представляет собой плоскость, то он образован двумя направлениями, называемыми первым направлением и вторым направлением.

Расстояние между многообразием S и гиперплоскостью π вычисляют в точке Р на гиперплоскости. Р определяется n координатами. Например, если гиперплоскость представляет собой ось, то Р определяется одной координатой δ1 вдоль одного направления, а если гиперплоскость представляет собой плоскость, то Р определяется парой указанных координат (δ0, δ1), где δ0 имеет название "первая координата" и определена вдоль первого направления, a δ1 имеет название "вторая координата" и определена вдоль второго направления. Если явно не указано иное, указание на координату δ0 описывает необязательный вариант, который является предполагаемым в том случае, если S представляет собой поверхность, а π представляет собой плоскость.

Направления отмечены с использованием тех же греческих букв, что и соответствующие координаты, за исключением того, что направления отмечены с использованием подчеркнутых греческих букв для указания того, что они являются векторами. Таким образом, первое направление отмечено как δ0, а второе направление отмечено как δ1.

На Фиг. 32А изображена гиперплоскость π для случая n=2. В рамках данных вариантов π представляет собой плоскость, образованную направлениями δ0 и δ1. Также показана точка Р с координатами (δ0, δ1). Направления δ0 и δ1 показаны как ортогональные по отношению к друг другу, однако это не является обязательным, поскольку угол между δ0 и δ1 может быть отличным от 90°. На плоскости π присутствует представляющий интерес планарный участок πROI, расположенный от минимальной первой координаты δ0,MIN до максимальной первой координаты δ0,MAX вдоль направления δ0 и от минимальной второй координаты δ1,MIN до максимальной второй координаты δ1,MAX вдоль направления δ1. Точка Р расположена в рамках представляющего интерес участка πROI. Если n=1 (не показано), то π представляет собой ось, а представляющий интерес участок πROI представляет собой линейный сегмент π, расположенный от δ1,MIN до δ1,MAX вдоль направления δ1.

Вычисление первого расстояния d приведено на Фиг. 32В, на которой показана гиперплоскость π и многообразие S. Расстояние d измеряют от S до точки Р перпендикулярно π. Следует понимать, что в то время как каждый из объектов π и S показан в виде одномерной линии, это необязательно должно быть так, поскольку S и π в целом представляют собой n-мерные математические объекты. Например, если S представляет собой поверхность, а π представляет собой плоскость, то как π, так и S в целом представляют собой двумерные математические объекты. Сегмент SROI S расположен выше представляющего интерес участка πROI. Например, если π представляет собой плоскость, то πROI представляет собой планарный представляющий интерес участок, а если π представляет собой ось, то πROI представляет собой линейный сегмент вдоль оси. Таким образом, πROI представляет собой проекцию SROI на π. Для n=2 SROI предпочтительно представляет собой непланарный сегмент (поверхности) S, а для n=1 SROI предпочтительно представляет собой кривой сегмент (кривой) S.

Каждая из n координат задана комбинацией значений экспрессии полипептидов. Например, для n=1 координата δ1 задана комбинацией значений экспрессии полипептидов, а для n=2 каждая из координат δ0 и δ1 задана отличной комбинацией значений экспрессии полипептидов.

Например, δ1 и необязательно также δ0 представляют собой комбинацией полипептидов, в соответствии со следующим уравнением:

δ00+a1D1+a2D2+…+φ0

δ1=b0+b1D1+b2D2+…+φ1,

где а0, а1, … и b0, b1, … представляют собой неизменные и предварительно определенные коэффициенты, а каждая из переменных D1, D2, … представляет собой уровни экспрессии одного из полипептидов, а φ0 и φ1 представляют собой функции, которые являются нелинейными в отношении, по меньшей мере, одного из уровней экспрессии.

Каждая из функций φ0 и φ1 является необязательной и может независимо возвращать ноль (или, эквивалентным образом, не включаться при вычислении соответствующей координаты). Если φ0=0, то координата δ0 представляет собой комбинацию полипептидов, а если φ1=0, то координата δ1 представляет собой комбинацию полипептидов.

Нелинейные функции φ0 и φ1 могут быть необязательно и предпочтительно выражены в виде степеней уровней экспрессии, например в соответствии со следующими выражениями:

φ0iqiXiγi

φ1iriXiλi,где i представляет собой индекс суммирования, qi и ri представляют собой наборы коэффициентов, Xi ∈ {D1, D2, …}, а каждый из γi и λi представляет собой численную экспоненту. Следует обратить внимание, что ряд членов в каждой из нелинейных функций φ0 и φ1 не обязательно равняется количеству полипептидов и что два или более члена в каждой сумме могут соответствовать одному полипептиду, хотя и с отличной численной экспонентой.

Соответствующие примеры коэффициентов, подходящих для настоящих вариантов осуществления изобретения, приведены в разделе Примеры далее (см. Таблицы 3, 13-17, 29 и 31-36).

Если φ0=0, φ1=0 и полипептиды включают TRAIL, то δ0 необязательно и предпочтительно представляет собой возрастающую функцию значения экспрессии TRAIL, а δ1 представляет собой убывающую функцию TRAIL. Если φ0=0, φ1=0 и полипептиды включают CRP, то δ1 и необязательно также δ0 необязательно и предпочтительно представляют собой возрастающие функции значения экспрессии CRP. Если полипептиды включают IP-10, то δ1 и необязательно также δ0 необязательно и предпочтительно представляют собой возрастающие функции значения экспрессии IP-10.

В вариантах осуществления изобретения, в рамках которых φ0=0, φ1=0 и полипептиды включают TRAIL, CRP и IP-10, каждый из δ0 и δ1 может представлять собой линейную комбинацию TRAIL, CRP и IP-10 в соответствии со следующим уравнением:

δ001С+a2I+а3Т

δ1=b0+b1C+b2I+b3T,

где С, I и Т представляют собой, соответственно, уровни экспрессии CRP, IP-10 и TRAIL.

Предпочтительно, как a1, так и b1 являются положительными. Предпочтительно, как а2, так и b2 являются положительными.

Предпочтительно, а3 является положительным, а b3 является отрицательным. Соответствующие примеры коэффициентов, подходящих для вариантов осуществления изобретения, в рамках которых комбинация представляет собой линейную комбинацию, а полипептиды представляют собой CRP, IP-10 и TRAIL, приведены в разделе Примеры далее (см. Таблицы 3, 13-17 и 33).

В вариантах осуществления, в рамках которых φ0≠0, φ1≠0 и полипептиды включают TRAIL, CRP и IP-10, каждый δ0 и δ1 может представлять собой комбинацию TRAIL, CRP и IP-10 в соответствии со следующими уравнениями:

δ001С+a2I+a3T+φ0

δ1=b0+b1C+b2I+b3T+φ1,

где каждый из φ0 и φ1 представляет собой нелинейную функцию, по меньшей мере, одного или, по меньшей мере, двух из С, I и Т. В качестве соответствующего примера φ0 и φ1 могут быть выражены как:

φ0=q1Cγ1+q2Cγ2+q3Tγ3

φ1=r1Cγ1+r2Cγ2+r3Tγ3.

Соответствующие примеры коэффициентов, подходящих для вариантов осуществления изобретения, в рамках которых полипептиды представляют собой CRP, IP-10 и TRAIL, а нелинейные функции не возвращают ноль, приведены в разделе Примеры далее (см. Таблицу 36).

Границы δ0,MIN, δ0,MAX, δ1,MIN и δ1,MAX πROI предпочтительно соответствуют физиологически возможным диапазонам значений экспрессии полипептидов.

При измерении с применением протоколов, описанных ниже в Примере 8, более предпочтительно в Примере 9, физиологически возможные диапазоны составляют, как правило, от 0 до около 400 мкг/мл (CRP), от 0 до около 3000 пг/мл (IP-10) и от 0 до около 700 пг/мл (TRAIL). Некоторые субъекты могут демонстрировать концентрации, которые лежат вне данных диапазонов. - В рамках различных примеров вариантов осуществления изобретения если значения экспрессии TRAIL, CRP и IP-10 измеряют в соответствии с протоколом, описанным ниже в Примере 8, более предпочтительно в Примере 9, значения коэффициентов а0,…,а3 и b0,…,b3 берут из Таблицы 3 ниже, а границы πROI составляют: δ0,MIN=- -1.3 δ0,MAX=45 δ1,MIN=-14.3 и δ1,MAX=49.6.

При измерении значений экспрессии TRAIL, CRP и IP-10 с применением протокола, которые отличает от протокола, описанного ниже в Примере 8, более предпочтительно в Примере 9, значения коэффициентов а0,…,a3 и b0,…,b3 отличаются от значений в Таблице 3 ниже, и, таким образом, границы πROI также отличаются от указанных выше значений. В подобных случаях значения коэффициентов и границ коррелирует с вышеуказанными значениями, при этом корреляцию каждого коэффициента и границы получают на основе корреляции между значением экспрессии соответствующего белка при измерении в соответствии с протоколом, описанным в Примере 8, более предпочтительно в Примере 9, и значением экспрессии соответствующего белка при реальном измерении.

По крайней мере, основная часть сегмента SROI кривого объекта S расположена между двумя кривыми объектами, которые далее называют нижним ограничивающим кривым объектом SLB и верхним ограничивающим кривым объектом SUB.

В соответствии с используемым здесь значением, термин "основная часть сегмента SROI" означает часть сглаженного варианта SROI, чья длина (при n=1), площадь поверхности (при n=2) или объем (при n≥3) составляет 60% или 70% или 80% или 90% или 95% или 99% сглаженного варианта длины, площади поверхности или объема SROI, соответственно.

В соответствии с используемым здесь значением, термин "сглаженный вариант сегмента SROI" означает сегмент SROI за исключением участков SROI вблизи точек, где гауссова кривизна превышает предельное значение кривизны, составляющее Х-кратную величину медианной кривизны SROI, при этом X равен 1,5 или 2 или 4 или 8.

Нижеследующая процедура может применяться с целью определения того, расположена ли основная часть сегмента SROI между SLB и SUB. Во-первых, получают сглаженный вариант сегмента SROI. Во-вторых, вычисляют длину (при n=1), площадь поверхности (при n=2) или объем (при n≥3) А1 сглаженного варианта сегмента SROI. В-третьих, вычисляют длину (при n=1), площадь поверхности (при n=2) или объем (при n≥3) А2 части сглаженного варианта сегмента SROI, расположенного между SLB и SUB. В-четвертых, вычисляют процентное отношение А2 к А1.

На Фиг. 33А-D показана процедура получения сглаженного варианта SROI.

Для лучшего понимания SROI изображен в виде одномерного сегмента, однако специалисту в данной области будет очевидно, что SROI в целом представляет собой n-мерный математический объект. Гауссова кривизна вычисляется для достаточного количества точек на SROI. Например, при отображении многообразия в виде точечного множества гауссова кривизна может быть вычислена для точек, являющихся частью точечного множества. Затем получают медиану гауссовой кривизны и вычисляют предельную кривизну путем умножения полученной медиана на X На Фиг. 33А показан SROI перед проведением операции сглаживания. Отмечен участок 320 с одной или несколькими точками 322, в которых гауссова кривизна превышает предельную кривизну. Точка или точка, в которых гауссова кривизна является максимальной в участке 320, удалена, а участок 320 плавно интерполирован, например с помощью полиномиальной интерполяции (Фиг. 33В). Удаление и интерполяция повторяются несколько раз (Фиг. 33С) до момента, когда сегмент SROI не содержит участков, в которых гауссова кривизна превышает предельную кривизну (Фиг. 33D).

Если n=1 (то есть когда S представляет собой кривую линию), то SLB представляет собой нижнюю ограничивающую кривую, a SUB представляет собой верхнюю ограничивающую кривую. В рамках данных вариантов осуществления изобретения SLB и SUB могут быть записаны в форме:

SLB=f(δ1)-ε0,

SUB=f(δ1)+ε1

где f(δ1) представляет собой функцию вероятностной классификации координаты δ1 (вдоль направления δ1), которая отражает вероятность того, что тестируемый субъект имеет бактериальную инфекцию. В некоторых вариантах осуществления изобретения f(δ1)=1/(1+exp(δ1)). Каждый из SLB и SUB является положительным для любого значения δ1 в рамках πROI. Также рассматриваются варианты осуществления изобретения, в рамках которых f(δ1) представляет собой функцию вероятностной классификации, которая отражает вероятность того, что тестируемый субъект имеет вирусную инфекцию. Также рассматриваются варианты осуществления изобретения, в рамках которых f(δ1) представляет собой функцию вероятностной классификации, которая отражает вероятность того, что тестируемый субъект имеет инфекцию.

Если n=2 (то есть если S представляет собой кривую поверхность), то SLB представляет собой нижнюю ограничивающую кривую поверхность, a SUB представляет собой верхнюю ограничивающую кривую поверхность. В рамках данных вариантов осуществления изобретения SLB и SUB могут быть записаны в форме:

SLB=f(δ01)-ε0,

SUB=f(δ01)+ε1

где f(δ01) представляет собой функцию вероятностной классификации первой и второй координаты (вдоль первого и второго направления), которая отражает вероятность того, что тестируемый субъект имеет бактериальную инфекцию. В некоторых вариантах осуществления изобретения f(δ01)=exp(δ1)/(1+exp(δ0)+exp(δ1)). Как SLB, так и SUB являются положительными для любого значения δ0 и δ1 в рамках πROI.

В рамках любого из указанных выше вариантов осуществления каждый из параметров ε0 и ε1 составляет менее чем 0,5 или менее чем 0,4 или менее чем 0,3 или менее чем 0,2 или менее чем 0,1 или менее чем 0,05.

На Фиг. 31 способ далее включает пункт 312, в рамках которого вычисленное расстояние d коррелируется с присутствием, отсутствием, или вероятностью того, что субъект имеет заболевание или состояние, соответствующее типу вероятностной функции f. Например, если вероятностная функция f отражает вероятность того, что тестируемый субъект имеет бактериальную инфекцию, то вычисленная вероятность d коррелируется с присутствием, отсутствием или вероятностью того, что субъект имеет бактериальную инфекцию.

В рамках различных примеров вариантов осуществления изобретения данное определение корреляции включает определение того, что расстояние d представляет собой вероятность того, что субъект имеет бактериальную инфекцию. Данная вероятность необязательно и предпочтительно сравнивается с предварительно определенным пороговым значением ωB, при этом способ может обеспечивать возможность определения того, что субъект вероятно имеет бактериальную инфекцию, если вероятность превышает ωB, и что он вероятно не имеет бактериальную инфекцию в ином случае. Обычные значения сов включают, без ограничения, 0,2, около 0,3, около 0,4, около 0,5, около 0,6 и около 0,7. Также включены другие предельные значения вероятности.

В рамках некоторых вариантов осуществления настоящего изобретения, если способ обеспечивает определение того, что субъект вероятно имеет бактериальную инфекцию, то субъект подвергается лечению бактериальной инфекции (316), как подробно описано здесь.

Авторы настоящего изобретения обнаружили функцию вероятностной классификации g(δ01), которая отражает вероятность того, что тестируемый субъект имеет вирусную инфекцию. В различных примерах вариантов осуществления изобретения g(δ01) равняется exp(δ0)/(1+exp(δ0)+exp(δ1)).

Функция g может также применяться, в соответствии с некоторыми вариантами осуществления настоящего изобретения, для оценки присутствия, отсутствия или вероятности того, что субъект имеет вирусную инфекцию. Таким образом, в некоторых вариантах осуществления изобретения способ включает пункт 313, в рамках которого вычисляют второе расстояние между сегментом второй кривой поверхности и плоскостью π, а также пункт 314, в рамках которого второе расстояние коррелируется с наличием, отсутствием или вероятностью того, что субъект имеет вирусную инфекцию. Процедура и определения, соответствующие пунктам 313 и 314, аналогичны процедуре и определениям, соответствующим пунктам 311 и 312, которые описаны выше, mutatis mutandis. Таким образом, например, основная часть сегмента второй поверхности расположена между второй нижней ограничивающей поверхностью g(δ01)-ε2 и второй верхней ограничивающей поверхностью g(δ01)+ε3, при этом каждый из ε2 и ε3 составляет менее 0,5 или менее 0,4 или менее 0,3 или менее 0,2 или менее 0,1 или менее 0,05.

В рамках некоторых вариантов осуществления настоящего изобретения если способ обеспечивает определение того, что субъект вероятно имеет вирусную инфекцию, то субъект подвергается лечению вирусной инфекции (316), как подробно описано здесь.

В рамках различных примеров вариантов осуществления изобретения данная корреляция включает определение того, что второе расстояние представляет собой вероятность того, что субъект имеет вирусную инфекцию. Данная вероятность необязательно и предпочтительно сравнивается с предварительно определенным пороговым значением ωV, при этом способ может обеспечивать возможность определения того, что субъект вероятно имеет вирусную инфекцию, если вероятность превышает ωV, и что он вероятно не имеет вирусную инфекцию в ином случае. Обычные значения ωV включают, без ограничения, около 0,5, около 0,6, около 0,7 и около 0.8. Также включены другие предельные значения вероятности.

В вариантах осуществления изобретения, в рамках которых осуществляются операции 313 и 314, операции 311 и 312 могут либо осуществляться, либо не осуществляться. Например, настоящие варианты осуществления предусматривают процедуру, в рамках которой операции 311 и 312 не осуществляются, при этом способ обеспечивает определение вероятности того, что субъект имеет вирусную инфекцию, без вычисления первого расстояния и без коррелирования первого расстояния с наличием, отсутствием или вероятностью того, что субъект имеет бактериальную инфекцию.

Альтернативно, могут быть осуществлены все операции 311-314, при этом 311 и 312 осуществляются безотносительно результата операции 314, а 313 и 314 осуществляются безотносительно результата 312. В рамках данных вариантов осуществления способ необязательно и предпочтительно включает определение как вероятности того, что субъект имеет бактериальную инфекцию, так и вероятности того, что субъект имеет вирусную инфекцию. Каждая из данных вероятностей может быть подвергнута сравнению с соответствующим предварительно определенным пороговым значением (ωB или ωV). Если каждая из данных вероятностей находится ниже соответствующего порового значения, способ обеспечивает определение того, что пациент вероятно имеет небактериальное и невирусное инфекционное заболевание. Например, способ может обеспечивать определение того, что субъект вероятно имеет неинфекционное заболевание, грибковое заболевание или паразитическое заболевание.

Альтернативно, осуществление некоторых операций зависит от результата одной или нескольких других операций. Например, способ может включать осуществление операций 311 и 312 для определения вероятности того, что субъект имеет бактериальную инфекцию. После этого определенная вероятность сравнивается с пороговым значением ωB. В рамках способа пропускается осуществление операций 313 и 314, если определенная вероятность превышает сов, и осуществляются операции 313 и 314 в ином случае. Другой пример данных вариантов осуществления представляют собой процедуру, в рамках которой способ включает осуществление операций 313 и 314 для определения вероятности того, что субъект имеет вирусную инфекцию. После этого определенная вероятность сравнивается с пороговым значением ωV. В рамках способа пропускается осуществление операций 311 и 312, если определенная вероятность превышает ωV, и осуществляются операции 311 и 312 в ином случае.

Способ необязательно и предпочтительно достигает пункта 315, в рамках которого генерируются выходные данные по вероятности (вероятностям). Выходные данные могут быть представлены в виде текста, и/или графически и/или с применением значений цвета. Выходные данные могут необязательно включать результаты сравнения с пороговым значением ωB. На Фиг. 29A-F и 38А-Е показаны примеры выходных данных для различения бактериальной и небактериальной инфекции в соответствии с одним вариантом осуществления настоящего изобретения.

Способ оканчивается на пункте 317.

Фиг. 38А-Е представляют собой скриншоты графического пользовательского интерфейса (GUI), являющегося подходящим для введения пользователем данным в рамках способа с применением компьютера для анализа биологических данных в соответствии с некоторыми вариантами осуществления настоящего изобретения.

GUI включает элемент управления для активации вычислений 390, который может быть представлен в виде элемента управления в форме кнопки. GUI также может включать множество полей для ввода значений экспрессии 380, при этом каждое поле для ввода значения экспрессии сконфигурировано для получения от пользователя значения экспрессии полипептида в крови субъекта. Пользователь заполняет поля для ввода значениями экспрессии полипептидов. Альтернативно, значения экспрессии могут быть получены путем установления соединения между компьютером и внешним устройством (не показано), которое измеряет значения экспрессии. В рамках данных вариантов осуществления для пользователя необязательно вводить значения экспрессии в поля для ввода вручную. В некоторых вариантах осуществления GUI включает коммуникационный элемент управления 392, например в виде элемента управления в форме кнопки, при этом связь с внешним устройством осуществляется в ответ на активацию коммуникационного элемента управления пользователем.

В ответ на активацию элемента управления 390 пользователем компьютер вычисляет балл на основе значений экспрессии, полученных автоматически или через поля для ввода 380. Балл может представлять собой вероятность того, что субъект имеет бактериальную инфекцию и/или вирусную инфекцию. Балл может быть вычислен, например, путем вычисления расстояния между кривой поверхностью и плоскостью, образованной двумя направлениями, как подробно описано выше.

На GUI может быть сгенерирована графическая шкала 382. Графическая шкала может включать первый конец, идентифицированный в качестве соответствующего вирусной инфекции, и второй конец, идентифицированный в качестве соответствующего бактериальной инфекции.

При вычислении балла на графическую шкалу 382 может быть необязательно и предпочтительно нанесена метка 394 в месте, соответствующем вычисленной вероятности. На Фиг. 38А показан GUI перед введением значений в поля для ввода, на Фиг. 38 В показана отметка 394 на шкале 382 в месте, которое соответствует 96% вероятности того, что инфекция является бактериальной, а на Фиг. 38С показана отметка 394 на шкале 382 в месте, которое соответствует 1% вероятности того, что инфекция является бактериальной (или, эквивалентно, 99% вероятности, что инфекция является вирусной). Необязательно GUI также отображает вычисленный балл в числовом виде.

GUI необязательно и предпочтительно включает один или несколько дополнительных элементов управления 386, 388, которые могут быть в форме элементов управления в виде кнопок. Например, элемент управления 388 может заставлять компьютер очищать поля для ввода 380, когда пользователь активирует элемент управления 388. Это позволяет пользователю вводить значения, которые соответствуют другому образцу. В некоторых вариантах осуществления GUI также генерирует выходные данные 384, которые обобщают результаты предыдущих образцов. Элемент управления 386 может заставлять компьютер очищать поля для ввода 380, а также выходные данные 384, когда пользователь активирует элемент управления 386. Это позволяет пользователю начинать новый сеанс вычислений (необязательно с применением нескольких образцов) без выхода из GUI.

Соответствующий пример протокола, который является подходящим для настоящих вариантов осуществления изобретения, является следующим.

GUI представляет аутентифицированному пользователю диалог, который позволяет пользователю вводить значения контроля качества (QC) эксперимента. QC проверяется и генерируется GUI, показанный на Фиг. 38А. Пользователь вводит значения экспрессии в поля для ввода 380 и активирует элемент управления 390 для получения результата (например, как показано на Фиг. 38В и 38С). Для введения значений экспрессии другого образца крови пользователь активирует элемент управления 388. Результат каждого образца добавляется в выходные данные 384, которые могут быть представлены, например, в форме таблицы. Для проведения нового эксперимента без закрытия программы или выхода пользователь активирует элемент управления 386 для очистки полей для ввода 384 и вводит новые значения QC. Предпочтительно, все операции записываются в один или несколько log-файлов.

В некоторых вариантах осуществления настоящего изобретения GUI также включает экран для отчетов (Фиг. 38D и 38Е), на котором отображаются результаты предыдущих экспериментов, например в ответ на запрос, связанный с определенной датой.

Очевидно, что представленные здесь названия полипептидов приведены лишь в качестве примеров. Специалистам в данной области будут очевидны многие альтернативные названия, наименования, модификации, изоформы и вариации. Соответственно, изобретение включает все альтернативные названия белков, наименования, модификации, изоформы и вариации.

Генетические продукты указаны на основе официальной буквенной аббревиатуры или символа гена, присвоенного Комитетом по наименованиям Международной организации по изучению генома человека (HGNC), и подвергнуты листингу на дату подачи данной заявки на веб-сайте Национального центра биотехнологической информации США (NCBI), также известном как Entrez Gene.

TRAIL: Кодируемый данным геном белок, TNF-связанный апоптоз-индуцирующий лиганд (TRAIL), представляет собой цитокин, который принадлежит к семейству лигандов-факторов некроза опухоли (TNF). Дополнительные названия данного гена включают, без ограничения, AP02L, TNF-связанный апоптоз-индуцирующий лиганд, TNFSF10 и CD253. TRAIL существует в мембраносвязанной форме и растворимой форме, обе из которых могут индуцировать апоптоз в различных клетках, таких как трансформированные опухолевые клетки. Данный белок связывается с несколькими членами суперсемейства TNF-рецепторов, такими как TNFRSF10A/TRAILR1, NFRSF10B/TRAILR2, NFRSF10C/TRAILR3, TNFRSF10D/TRAILR4, и вероятно также с NFRSF 11B/OPG. Активность данного белка может модулироваться за счет связывания с рецепторами-приманками, такими как NFRSF 10C/TRAILR3, TNFRSF 10D/TRAILR4 и NFRSF11B/OPG, которые не могут индуцировать апоптоз. Было показано, что связывание данного белка с его рецепторами вызывает активацию MAPK8/JNK, каспазы 8 и каспазы 3. Для данного гена были обнаружены подвергнутые альтернативному сплайсингу транскриптные варианты, кодирующие иные изоформы. TRAIL может быть подвергнут протеолитическому отщеплению от поверхности клетки для получения растворимой формы, которая обладает гомотримерной структурой.

В соответствии с определенным вариантом осуществления изобретения измеряют уровень растворимой (то есть секретируемой) формы TRAIL.

В соответствии с другим вариантом осуществления изобретения измеряют уровень мембранной формы TRAIL.

В соответствии с другим вариантом осуществления изобретения измеряют как уровень мембранной формы TRAIL, так и уровень секретируемой формы TRAIL.

В соответствии с другим аспектом настоящего изобретения предусмотрен способ определения типа инфекции у субъекта, включающий измерение концентрации растворимого TRAIL и нерастворимого TRAIL, при этом концентрация свидетельствует о типе инфекции.

В одном варианте осуществления изобретения, когда концентрация растворимого TRAIL превышает предварительно определенное пороговое значение, делается заключение об отсутствии бактериальной инфекции у субъекта.

В другом варианте осуществления, когда концентрация растворимого TRAIL превышает предварительно определенное пороговое значение, делается заключение о наличии вирусной инфекции у субъекта.

Примеры белковых последовательностей для растворимого TRAIL указаны в SEQ ID NO: 37 и SEQ ID NO: 38.

Пример мРНК последовательности мембранного TRAIL человека указан в SEQ IDNO: 1.

Пример аминокислотных последовательностей мембранного TRAIL человека указан в SEQ ID NO: 4.

Другие примеры последовательностей кДНК и аминокислот для TRAIL указаны в SEQ ID NO: 2, 3 и 5-8.

IP-10: Данный ген кодирует хемокин подсемейства СХС и лиганд для рецептора CXCR3. Связывание данного белка с CXCR3 приводит к плейотропным эффектам, включая стимулирование миграции моноцитов, естественных киллеров (NK-клеток) и Т-клеток, а также к модулированию экспрессии молекул адгезии. Дополнительные названия данного гена включают, без ограничений: IP-10, CXCL10, гамма-IP 10, INP10 и хемокиновый (С-Х-С мотив) лиганд 10.

Пример последовательности кДНК IP-10 человека указан в SEQ ID NO: 9-12. Пример аминокислотной последовательности IP-10 человека указан в SEQ ID NO: 13.

CRP: С-реактивный белок; дополнительные наименования CRP включают, без ограничения, RP11-419N 10.4 и РТХ1. Белок, кодируемый данным геном, принадлежит к семейству пентаксинов. Он принимает участие в некоторых связанных с защитой организма функциях на основе его способности распознавать чужеродные патогены и поврежденные клетки организма, а также инициировать их уничтожение путем взаимодействия с гуморальными и клеточными эффекторными системами в крови. Как следствие, уровень данного белка в плазме сильно повышается при острой фазе реакции на повреждение ткани, инфекцию или другие воспалительные стимулы. CRP присущи несколько функций, связанных с защитой организма: он промотирует агглютинацию, разбухание бактериальной капсулы, фагоцитоз и связывание комплемента благодаря его кальций-зависимому связыванию с фосфорилхолином.

Пример последовательности кДНК CRP человека указан в SEQ ID NO: 14-16.

Пример аминокислотной последовательности CRP человека указан в SEQ IDNO: 17.

IL1RA: Белок, кодируемый данным геном, представляет собой цитокиновый рецептор, которые принадлежит к семейству рецепторов интерлейкина-1. Данный белок представляет собой рецептор интерлейкина-альфа (ILIA), интерлейкина-бета (IL1B) и рецептор интерлейкина-1 тип I (IL1R1/IL1RA). Он является важным медиатором, принимающим участие во многих цитокин- индуцированных иммунных и воспалительных реакциях. Дополнительные названия данного гена включают, без ограничений: CD121A, IL-1RT1, р80, антиген CD121a, CD121A, IL1R и IL1ra.

Примеры последовательностей кДНК IL1RA человека указаны в SEQ ID NO: 18, 19 и 20.

Примеры аминокислотных последовательностей IL1RA человека указаны в SEQ ID NO: 21-24.

РСТ. Прокальцитонин (РСТ) представляет собой пептидный прекурсор гормона кальцитонина, при этом последний принимает участие в кальциевом гомеостазе. Прокальцитонин (РСТ) представляет собой белок, состоящий из 116 аминокислот и имеющий молекулярную массу около 13000 Да. Он представляет собой прогормон кальцитонина, который при нормальных метаболических условиях продуцируется и секретируется С-клетками щитовидной железы. Синтез РСТ и кальцитонина инициируется путем трансляции препрокальцитонина ("pre-РСТ"), являющегося прекурсорным пептидом, включающим 141 аминокислоту. Аминокислотная последовательность pre-РСТ была описана Moullec et al. в FEBS Letters, 167:93-97 в 1984. РСТ образуется после расщепления сигнального пептида (первые 24 аминокислот pre-РСТ).

Примеры последовательностей кДНК РСТ человека указаны в SEQ ID NO: 31-32.

Примеры аминокислотных последовательностей РСТ человека указаны в SEQ ID NO: 33-36.

SAA: кодирует член семейства А сывороточных амилоидных аполипопротеинов. Кодируемый белок представляет собой крупный белок острой фазы, который экспрессируется в большом количестве при реакции на воспаление и повреждение ткани. Данный белок также играет важную роль при метаболизме липопротеинов высокой плотности (HDL) и гомеостазе холестерина. Высокие уровни данного белка связаны с хроническими воспалительными заболеваниями, включая атеросклероз, ревматоидный артрит, болезнь Альцгеймера и болезнь Крона. Данный белок также может представлять собой потенциальный биомаркер определенных видов опухолей. Изменение сплайсинга приводит к получению множества транскриптных вариантов, которые кодируют тот же белок.

Примеры последовательностей кДНК SAA человека указаны в SEQ ID NO: 25-27.

Примеры аминокислотных последовательностей SAA человека указаны в SEQ ID NO: 28-30.

Следует отметить, что поскольку вариации ДНК от пациента к пациенту могут приводить к случаям однонуклеотидного полиморфизма (SNP), которые могут вызывать появление различий в аминокислотной последовательности белков, авторы настоящего изобретения также включили белки с аминокислотными последовательностями, которые являются, по меньшей мере, на 90%, 95% или 99% гомологичными относительно указанных здесь выше последовательностей.

Результаты измерения уровней полипептидов (например, TRAIL, IP-10 и CRP) обычно зависят от уровня белка, как описано ниже.

Способы детектирования экспрессии и/или активности белков

Уровень экспрессии и/или активности белков, экспрессируемых в клетках культур в рамках некоторых вариантов осуществления изобретения, может быть определен с применением способов, которые известны из уровня техники и обычно включают применение антител. Подобные способы могут быть отнесены к иммуноанализам. Иммуноанализы могут быть проведены в рамках нескольких этапов с добавлением реагентов и промыванием или отделением в различные моменты времени при проведении анализа. Многоэтапные анализы часто называют сепарационными иммуноанализами или гетерогенными иммуноанализами. Некоторые иммуноанализы могут быть проведены просто путем смешивания реагентов и образца и осуществления физического измерения. Подобные анализы называют гомогенными иммуноанализами или (менее часто) несепарационными иммуноанализами. При проведении иммуноанализов зачастую применяют калибратор. Калибраторы представляют собой растворы, которые содержат исследуемый аналит, при этом концентрация данного аналита в целом является известной. Сравнение реакции анализа на реальный образец против реакции анализа, полученной с применением калибраторов, делает возможной интерпретацию силы сигнала в плане присутствия или концентрации аналита в образце.

Антитело может являться моноклональным, поликлональным, химерным или их фрагментом, при этом этап детектирования продукта реакции может быть осуществлен с применением любого подходящего иммуноанализа.

Подходящие источники антител для детектирования полипеитидов включают коммерчески доступные источники, такие как, например, Abazyme, Abnova, AssayPro, Affinity Biologicals, AntibodyShop, Aviva bioscience, Biogenesis, Biosense Laboratories, Calbiochem, Cell Sciences, Chemicon International, Chemokine, Clontech, Cytolab, DAKO, Diagnostic BioSystems, eBioscience, Endocrine Technologies, Enzo Biochem, Eurogentec, Fusion Antibodies, Genesis Biotech, GloboZymes, Haematologic Technologies, Immunodetect, Immunodiagnostik, Immunometrics, Immunostar, Immunovision, Biogenex, Invitrogen, Jackson ImmunoResearch Laboratory, KMI Diagnostics, Koma Biotech, LabFrontier Life Science Institute, Lee Laboratories, Lifescreen, Maine Biotechnology Services, Mediclone, MicroPharm Ltd., ModiQuest, Molecular Innovations, Molecular Probes, Neoclone, Neuromics, New England Biolabs, Novocastra, Novus Biologicals, Oncogene Research Products, Orbigen, Oxford Biotechnology, Panvera, PerkinElmer Life Sciences, Pharmingen, Phoenix Pharmaceuticals, Pierce Chemical Company, Polymun Scientific, Polysiences, Inc., Promega Corporation, Proteogenix, Protos Immunoresearch, QED Biosciences, Inc., R&D Systems, Repligen, Research Diagnostics, Roboscreen, Santa Cruz Biotechnology, Seikagaku America, Serological Corporation, Serotec, SigmaAldrich, StemCell Technologies, Synaptic Systems GmbH, Technopharm, Terra Nova Biotechnology, TiterMax, Trillium Diagnostics, Upstate Biotechnology, US Biological, Vector Laboratories, Wako Pure Chemical Industries и Zeptometrix. Тем не менее, специалист в данной области может без излишних трудозатрат получить антитела против любого из описанных здесь полипептидов.

Поликлональные антитела для измерения полипептидов включают, без ограничения, антитела, которые были получены из сывороток путем активной иммунизации одного или нескольких их следующих животных: кролика, козы, овцы, курицы, утки, морской свинки, мыши, осла, верблюда, крысы и лошади.

Примеры дополнительных агентов для детектирования включают, без ограничения: scFv, dsFv, Fab, sVH, F(ab')2, циклические пептиды, гаптамеры, однодоменное антитело, Fab-фрагменты, одноцепочечные вариабельные фрагменты, молекулы аффител, аффилины, нанофитины, антикалины, авимеры, DARP-ины (DARPins), домены Кунитца, финомеры и монотело.

Иммуносорбентный анализ с ферментной меткой (ELISA): Проведение ELISA включает применение, по меньшей мере, одного антитела со специфичностью в отношении определенного антигена. Образец с неизвестным количеством антигена иммобилизуют на твердой подложке (обычно используют полистирольный микротитровальный планшет) либо неспецифичным образом (путем адсорбции на поверхности), либо специфичным образом (посредством захвата другим антителом, являющимся специфичным по отношению к тому же антигену, в рамках "сэндвич"-анализа ELISA). После иммобилизации антигена добавляют антитело для детектирования, образующее комплекс с антигеном. Антитело для детектирования может ковалентно связываться с ферментом или само может подвергаться детектированию вторичным антителом, которое связано с ферментом путем биоконъюгации. Между каждым этапом планшет, как правило, промывают мягким чистящим раствором для удаления любых белков или антител, подвергнутых аспецифическому связыванию. После последнего этапа промывания планшет подвергают дальнейшей обработке добавлением ферментативного субстрата для продуцирования визуально наблюдаемого сигнала, что свидетельствует о количестве антигена в образце.

Ферменты, которые обычно применяют в рамках данного способа, включают пероксидазу хрена и щелочную фосфатазу. При условии правильной калибровки и соблюдения линейного характера ответного сигнала количество субстрата, присутствующего в образце, является пропорциональным количеству продуцируемого цвета. Субстратный стандарт в целом применяют для повышения количественной точности.

Вестерн-блот: Данный способ включает отделение субстрата от другого белка с помощью акриламидного геля с последующим переносом субстрата на мембрану (например, из нейлона или поливинилиденфторида). Присутствие субстрата затем детектируют с помощью антител, являющихся специфичными по отношению к субстрату, которые, в свою очередь, детектируются с помощью антителосвязывающих реагентов. Антителосвязывающие реагенты могу представлять собой, например, белок А или другие антитела. Антителосвязывающие реагенты могут быть помечены радиоактивным изотопом или быть связанными с ферментной меткой, как описано выше. Детектирование может осуществляться с помощью радиоавтографии, колориметрической реакции или хемилюминесценции. Данный способ обеспечивает как возможность проведения количественного анализа количества субстрата, так и определение его идентичности на основе относительного положения на мембране, что свидетельствует о расстоянии миграции в акриламидном геле при проведении электрофореза.

Сортировка клеток с активированной флуоресценцией (FACS): Данный способ включает детектирование субстрата in situ в клетках с помощью антител, являющихся специфичными по отношению к субстрату. Являющиеся специфичными по отношению к субстрату антитела связаны с флюорофорами. Детектирование осуществляется с помощью машины для сортировки клеток, которая считывает длину волны света, излучаемого из каждой клетки, при ее прохождении через луч света. Данный способ может включать одновременное применение двух или большего количества антител.

Автоматизированный иммуноанализ: Автоматизированный анализатор, применяемый в рамках проведения иммуноанализа (зачастую называемого "Автоматизированным иммуноанализом"), представляет собой медицинский лабораторный инструмент, приспособленный для быстрого измерения уровней различных химических веществ и других характеристик в рамках ряда биологических образцов с минимальным участием человека. Данные измеряемые свойства крови и других жидкостей могут применяться при диагностировании заболевания. Были изобретены различные способы помещения образцов в анализатор. Это может включать помещение тестовых пробирок с образцом в стойки, которые могут двигаться вдоль трека, или вставку пробирок в круглые поворотные механизмы, которые вращаются для доставки образца. Некоторые анализаторы требуют переноса образцов в чашки для образцов. Однако стремление защитить здоровье и безопасность персонала лабораторий побудило многих производителей разработать анализаторы, которые обеспечивают возможность работы с закрытыми пробирками, что предотвращает непосредственное контактирование работников с образцами. Образцы могут обрабатываться по одиночке, сериями или непрерывно. Примеры автоматических машин для проведения иммуноанализа включают, без ограничения, ARCHITECT ci4100, ci8200 (2003), ci16200 (2007), ARCHITECT i1000SR, ARCHITECT i2000 i2000SR, i4000SR, AxSYM/AxSYM Plus, 1994 U.S., DS2, AIMS, AtheNA, DSX, ChemWell, клиническую систему UniCel DxI 860i Synchron Access, клиническую систему UniCel DxC 680i Synchron Access, системы для проведения иммуноанализа Access/Access 2, систему для проведения иммуноанализа UniCel DxI 600 Access, клиническую систему UniCel DxC 600i Synchron Access, систему для проведения иммуноанализа UniCel DxI 800 Access, клиническую систему UniCel DxC 880i Synchron Access, клиническую систему UniCel DxI 660i Synchron Access, SPA PLUS (Specialist Protein Analyzer), иммуноаналитический анализатор VIDAS, BioPlex 2200, PhD System EVOLIS PR 3100TSC Photometer, автоматизированное обрабатывающее устройство на основе ФИА (ферментативного иммуноанализа) MAGO 4S/2011 Mago Plus, LIAISON XL/2010 LIAISON, ETI-MAX 3000 Agility, Triturus, HYTEC 288 PLUSDSX, иммунодиагностическую систему VITROS ECi, иммунодиагностическую систему VITROS 3600, Phadia Laboratory System 100E, Phadia Laboratory System 250, Phadia Laboratory System 1000, Phadia Laboratory System 2500, Phadia Laboratory System 5000, cobas e 602/2010, cobas e411, cobas e601, MODULAR ANALYTICS El70, Elecsys 2010, Dimension EXL 200/2011, интегрированную химическую систему Dimension Xpand Plus, интегрированную химическую систему Dimension RxL Max/Max Suite; интегрированную химическую систему Dimension RxL, интегрированную химическую систему Dimension EXL с LM, диагностическую систему Stratus CS Acute Care, иммуноаналитическую систему IMMULITE 2000 XPi, иммуноаналитическую систему ADVIA Centaur CP, IMMULITE 2000, IMMULITE 1000, умную лабораторную систему Dimension Vista 500, умную лабораторную систему Dimension Vista 1500, ADVIA Centaur XP, AIA-900, AIA- 360, AIA-2000, AIA-600 II, AIA-1800. Измерения CRP, IP-10 и TRAIL также могут быть осуществлены на аппарате Luminex.

Латеральные проточные иммуноанализы (LFIA): Данные анализы представляют собой технологию, которая обеспечивает быстрое измерения аналитов в месте оказания медицинской помощи (РОС); лежащие в его основе принципы описаны ниже. В соответствии с одним вариантом осуществления LFIA применяют в контексте карманного устройства.

Технология основана на серии капиллярных русел, таких как фрагменты пористой бумаге или спеченный полимер. Каждый из данных элементов обладает способностью обеспечивать спонтанный транспорт жидкости (например, мочи). Первый элемент (подушечка для образца) действует в качестве губки и удерживает избыток жидкости образца. При впитывании жидкость поступает во второй элемент (конъюгационную подушечку), в которую производитель поместил так называемый конъюгат, представляющий собой биоактивные частицы в высушенном виде (см. ниже) в сахарно-солевом матриксе, который содержит все необходимое для обеспечения оптимизированной химической реакции между молекулой-мишенью (например, антигеном) и его химическим партнером (например, антителом), который был иммобилизован на поверхности частицы. При растворении сахарно-солевого матрикса жидкостью образца она также растворяет частицы, при этом в рамках одного объединенного транспортного действия образец и конъюгат смешиваются при протекании через пористую структуру. Таким образом обеспечивается связывание аналита с частицами при миграции далее через третье капиллярное русло. Данный материал имеет один или несколько участков (часто называемых полосками), где производителем была иммобилизована третья молекула. К тому времени, когда смесь образца и конъюгата достигает данных полосок, аналит связывается частицей, при этом третья "захватывающая" молекула связывает комплекс.

Спустя некоторое время, когда все большее количество жидкости проходит через полоски, частицы скапливаются, и участок полоски меняет цвет. Как правило, присутствуют, по крайней мере, две полоски: одна (контроль), которая захватывает любую частицу и, таким образом, показывает, что реакционные условия и технология сработали правильным образом, и вторая, которая содержит определенную захватывающую молекулу и захватывает только те частицы, на которых была иммобилизована молекула аналита. После прохождения данных реакционных зон жидкость достигает конечного пористого материала, представляющего собой тампон, который попросту действует в качестве контейнера для отходов. Латеральные проточные тесты могут осуществляться в виде конкурентных анализов или сэндвич-анализов.

Иммуногистохимические анализы: Иммуноанализы, выполненные в соответствии с некоторыми вариантами осуществления настоящего изобретения, могут представлять собой гомогенные анализы или гетерогенные анализы. В рамках гомогенного анализа иммунологическая реакция обычно включает определенное антитело (например, анти-TRAIL, анти-CRP и/или анти-IP-10 антитело), помеченный аналит и представляющий интерес образец. Сигнал, полученный благодаря метке, подвергается модификации, напрямую или косвенным образом, при связывании антитела с помеченным аналитом. Как иммунологическая реакция, так и детектирование ее степени может быть осуществлено в гомогенном растворе. Иммунохимические метки, которые могут применяться, включают свободные радикалы, радиоизотопы, флуоресцентные красители, ферменты, бактериофаги или коферменты.

В рамках подхода с применением гетерогенного анализа реагенты обычно представляют собой образец, антитело и средства для продуцирования детектируемого сигнала. Могут применяться описанные выше образцы. Антитело может быть иммобилизовано на подложке, такой как шарик (например, на агарозных шариках на основе белка А и белка G), пластинка или предметное стекло, и подвергнуто контакту с образцом, в отношении которого предполагается содержание антигена в жидкой фазе.

В соответствии с определенным вариантом осуществления изобретения антитело иммобилизуют на пористой полоске для образования участка детектирования. Участок для измерения или детектирования пористой полоски может включать множество участков: один для TRAIL, один для CRP и один для IP-10. Тестовая полоска также может содержать участки для отрицательных и/или положительных контролей.

Альтернативно, контрольные участки могут быть расположены на полоске, являющейся отличной от тестовой полоски. Необязательно, различные участки для детектирования могут содержать различные количества антител, например более высокое количество в первом участке для детектирования и более низкие количества в последующих участках. При добавлении тестового образца количество участков, отображающих детектируемый сигнал, обеспечивает количественную индикацию количества полипептидов, присутствующих в образце. Участки для детектирования могут быть сконфигурированы в любой подходящей детектируемой форме и обычно представлены в форме полоски или точек, расположенных по ширине тестовой полоски.

Затем подложку отделяют от жидкой фазы и анализируют либо основную фазу, либо жидкую фазу на наличие детектируемого сигнала с применением средств для продуцирования подобного сигнала. Сигнал связан с наличием аналита в образце. Средства для продуцируемого детектируемого сигнала включают применение радиоактивных меток, флуоресцентных меток или ферментных меток. Например, если подвергаемый детектированию антиген содержит второй участок связывания, то антитело, которое связывается с данным участком, может быть конъюгировано с детектируемой группой или добавлено в реакционный раствор жидкой фазы перед этапом отделения. Наличие детектируемой группы на твердой подложке указывает на наличие антигена в тестируемом образце. Примеры подходящих иммуноанализов представляют собой способы на основе применения олигонуклеотидов, иммуноблоттинга, иммунофлуоресцентные способы, иммунопреципитацию, хемилюминесцентные способы, электрохемилюминесценцию (ECL) или иммуноанализы с применением ферментной метки.

Специалистам в данной области знакомы многочисленные конкретные форматы иммуноанализов и их вариации, которые могут применяться для осуществления описанного здесь способа. См., в основном, Е. Maggio, Enzyme- Immunoassay, (1980) (CRC Press, Inc., Boca Raton, Fla.); также см. патент США 4727022 Skold et al. titled "Methods for Modulating Ligand-Receptor Interactions and their Application," патент США 4659678 Forrest et al. titled "Immunoassay of Antigens," патент США 4376110 David et al., озаглавленный "Immunometric Assays Using Monoclonal Antibodies," патент США 4275149 Litman et al., озаглавленный "Macromolecular Environment Control in Specific Receptor Assays," патент США 4233402 Maggio et al., озаглавленный "Reagents and Method Employing Channeling," и патент США 4,230,767 Boguslaski et al., озаглавленный "Heterogenous Specific Binding Assay Employing a Coenzyme as Label."

Антитела могут быть конъюгированы с твердой подложкой, подходящей для проведения диагностического анализа (например, с шариками, такими как агарозные шарики на основе бека А или белка G, микросферы, пластинки, предметные стекла или лунки, сделанные из таких материалов, как латекс или полистирол) в соответствии с хорошо известными способами, такими как нереакционное связывание. Описанные здесь антитела могут быть аналогичным образом сконъюгированы с детектируемыми метками или группами, такими как радиометки (например, 35S, 125I, 131I), ферментными метками (например, пероксидазой хрена, щелочной фосфатазой) и флуоресцентными метками (например, флуоресцеином, Alexa, зеленым флуоресцентным белком, родамином) в соответствии с хорошо известными способами.

Моноклональные антитела для измерения TRAIL включают, без ограничения: мышь, моноклональное (55 В709-3) IgG; мышь, моноклональное (2Е5) IgG1; мышь, моноклональное (2Е05) IgG1; мышь, моноклональное (М912292) IgG1 каппа; мышь, моноклональное (IIIF6) IgG2b; мышь, моноклональное (2Е1-1 В9) IgG1; мышь, моноклональное (RIK-2) IgG1, каппа; мышь, моноклональное М181 IgG1; мышь, моноклональное VI10E IgG2b; мышь, моноклональное МАВ375 IgG1; мышь, моноклональное МАВ687 IgG1; мышь, моноклональное HS501 IgG1; мышь, моноклональный клон 75411.11 IgG1 мыши; мышь, моноклональное Т8175-50 IgG; мышь, моноклональное 2В2.108 IgG1; мышь, моноклональное В-Т24 IgG1; мышь, моноклональное 55В709.3 IgG1; мышь, моноклональное D3 IgG1; коза, моноклональное С19 IgG; кролик, моноклональное Н257 IgG; мышь, моноклональное 500-М49 IgG; мышь, моноклональное 05-607 IgG; мышь, моноклональное В-Т24 IgG1; крыса, моноклональное (N2B2), IgG2a, каппа; мышь, моноклональное (1А7-2В7), IgG1; мышь, моноклональное (55В709.3), IgG и мышь, моноклональное B-S23* IgG1, TRAIL/TNFSF10 MAb человека (клон75411), IgG1 мыши, TRAIL/TNFSF10 MAb человека (клон 124723), IgG1 мыши, TRAIL/TNFSF10 MAb человека (Clone 75402), IgG1 мыши.

Антитела для измерения TRAIL включают моноклональные антитела и поликлональные антитела для измерения TRAIL. Антитела для измерения TRAIL включают антитела, которые были разработаны для взаимодействия с эпитопами из перечня, состоящего из: рекомбинантного TRAIL человека, полученного на основе клеточной линии миеломы мыши NSO (Thr95-Gly281, кат. номер Р50591); рекомбинантного TRAIL человека, полученного на основе клеточной линии миеломы мыши NSO (Thr95-Gly281, с N-терминальной метиониновой и 6-гистидиновой меткой, кат. номер Р50591), полученного на основе Е. coli (Vail 14-Gly281, с/без N-терминального метионина, кат. номер Q6IBA9); TRAIL, полученного на основе сыворотки человека; рекомбинантного TRAIL человека, где первая аминокислота расположена между положениями 85-151, а последняя аминокислота расположена в положении 249-281.

Примеры моноклональных антител для измерения CRP включают, без ограничения: мышь, моноклональное (108-2А2); мышь, моноклональное (108-7G41D2); мышь, моноклональное (12D-2C-36), IgG1; мышь, моноклональное (1G1), IgG1; мышь, моноклональное (5А9), IgG2a каппа; мышь, моноклональное (63F4), IgG1; мышь, моноклональное (67А1), IgG1; мышь, моноклональное (8В-5Е), IgG1; мышь, моноклональное (В893М), IgG2b, лямбда; мышь, моноклональное (CI), IgG2b; мышь, моноклональное (C11F2), IgG; мышь, моноклональное (С2), IgG1; мышь, моноклональное (С3), IgG1; мышь, моноклональное (С4), IgG1; мышь, моноклональное (С5), IgG2a; мышь, моноклональное (С6), IgG2a; мышь, моноклональное (С7), IgG1; мышь, моноклональное (CRP103), IgG2b; мышь, моноклональное (CRP11), IgG1; мышь, моноклональное (CRP135), IgG1; мышь, моноклональное (CRP169), IgG2a; мышь, моноклональное (CRP30), IgG1; мышь, моноклональное (CRP36), IgG2a; кролик, моноклональное (EPR283Y), IgG; мышь, моноклональное (КТ39), IgG2b; мышь, моноклональное (N-a), IgG1; мышь, моноклональное (N1G1), IgG1; моноклональное (Р5А9АТ); мышь, моноклональное (S5G1), IgG1; мышь, моноклональное (SB78c), IgG1; мышь, моноклональное (SB78d), IgG1 и кролик, моноклональное(Y284), IgG, С-реактивные белок человека/CRP Biot MAb (CI 232024), IgG2B мыши, С-реактивный белок человека/CRP MAb (клон 232007), IgG2B человека, относящийся к человеку/мыши/свинье С-реактивный белок/CRP MAb (С1 232026), IgG2A мыши.

Антитела для измерения CRP включают моноклональные антитела для измерения CRP и поликлональные антитела для измерения CRP.

Антитела для измерения CRP также включают антитела, которые были разработаны для взаимодействия с эпитопами из перечня, состоящего из: CRP, полученного на основе плазмы человека; CRP, полученного из сыворотки человека; полученного на основе линии клеток миеломы мыши NS0 С-реактивного белка человека/CRP (Phe17-Pro224, кат .номер Р02741).

Примеры моноклональных антител для измерения IP-10 включают, без ограничения: IP-10/CXCL10 моноклональное антитело мыши против человека (4D5) (LifeSpan Biosciences), IP-10/CXCL10 моноклональное антитело мыши против человека (А00163.01) (LifeSpan Biosciences), IP-10 мыши против человека (AbD Serotec), IP-10 кролика против человека (AbD Serotec), IP-10 mAb человека 6D4 (Hycult Biotech), клон моноклонального антитела мыши против человека IP-10 В-С50 (Diaclone), клон моноклонального антитела мыши против человека IP-10 В-С55 (Diaclone), CXCL10/IP-10 клон MAb человека 33036 (R&D Systems), CXCLIO/INPIO антитело 1E9 (Novus Biologicals), CXCL10/INP10 антитело 2C1 (Novus Biologicals), CXCL10/INP10 антитело 6D4 (Novus Biologicals), клон моноклонального антитела CXCL10 M01A 2C1 (Abnova Corporation), CXCL10 моноклональное антитело (M05), клон 1E9 (Abnova Corporation), моноклональное антитело CXCL10, клон 1 (Abnova Corporation), IP-10 антитело 6D4 (Abeam), IP-10 антитело EPR7849 (Abcam), IP-10 антитело EPR7850 (Abcam).

Антитела для измерения IP-10 включают моноклональные антитела для измерения IP-10 и поликлональные антитела для измерения IP-10.

Антитела для измерения IP-10 также включают антитела, которые были разработаны для взаимодействия с эпитопами из перечня, состоящего из: рекомбинантного CXCL10 человека/IP-10; негликозилированной полипептидной цепи, содержащей 77 аминокислот (аминокислоты 22-98) и индуцируемый N- терминальной гистидиновой меткой интерферон гамма белок 10 (длиной 125 аминокислот); рекомбинантного IP-10 человека с IP-10 гистидиновой меткой в Е. Coli, содержащем фрагмент длиной 77 аминокислот (22-98) и имеющего общую молекулярную массу 8,5 кДа с амино-терминальной гексагистидиновой меткой; полученным на основе Е. coli IP-10 человека (Val22-Pro98) с N-терминальным метионином; IP-10, полученного на основе плазмы человека; IP-10, полученного на основе сыворотки человека; рекомбинантного IP-10 человека, где первая аминокислота расположена между положениями 1-24, а последняя аминокислота расположена в положении 71-98.

Очевидно, что уровень экспрессии описанных здесь полипептидом может представлять собой абсолютный уровень экспрессии, нормализованный уровень экспрессии и/или относительный уровень экспрессии.

В рамках общего научного контекста нормализация представляет собой процесс, посредством которого необработанные данные измерений конвертируются в данные, которые могут быть подвергнуты непосредственному сравнению с другими данными, нормализованными подобным образом. В контексте настоящего изобретения измерение уровней экспрессии подвержено ошибкам, возникающим вследствие, например, неодинаковой деградации измеряемых образцов, различным загрузочным количествам в рамках одного анализа, а также другим различным ошибкам. Более конкретно, любой проанализированный образец может содержать большее или меньшее количество материала, чем это требуется, вследствие человеческой ошибки и проблем с оборудованием. Таким образом, одна и та же ошибка или отклонение присуще как полипептиду по изобретению, так и контролю, экспрессия которого в целом является постоянной. Таким образом, разделение необработанных значений экспрессии TRAIL, IP-10 или CRP на необработанное значение экспрессии контроля обеспечивает получение отношения, которое по существу является свободным от каких-либо технических ошибок или неточностей (за исключением крупных ошибок, которые приводят к невозможности тестирования образца) и образует нормализованное значение экспрессии полипептида. Поскольку значения экспрессии контролей являются равными для различных образцов, они составляют общее контрольное значение, которое является корректным для подобной нормализации.

В соответствии с определенным вариантом осуществления изобретения каждое из значений экспрессии полипептидов подвергается нормализации с применением одного и того же контроля.

Очевидно, что абсолютные значения экспрессии зависят от применения одного и того же протокола, поскольку каждый протокол как правило приводит к получению различных соотношений сигнал/шум и, соответственно, различных значений концентраций. Более конкретно, в то время как общий тренд величин показателей биомаркеров будет сохраняться вне зависимости от протокола (например, TRAIL повышается при вирусных инфекциях и снижается при бактериальных инфекциях), измерительная шкала является зависимой от протокола.

Подобные изменения в плане измеряемых концентраций белков среди различных протоколов могут быть компенсированы путем коррелирования результатов измерений с применением двух протоколов и вычисления трансформационной функции, как показано в Примере 5 ниже.

Как правило, анализируемые образцы представляют собой образцы крови, включающие цельную кровь, сыворотку, плазму, лейкоциты или клетки крови. Предпочтительно, образец представляет собой цельную кровь, сыворотку или плазму.

Следует отметить, что TRAIL и IP-10 и CRP подвергаются высокой экспрессии в других тканях и образцах, включая, без ограничения, CSF, слюну и эпителиальные клетки, аспират костного мозга, мочу, стул, бронхоальвеолярный лаваж, мокроту. Таким образом, некоторые варианты осуществления настоящего изобретения могут применяться для измерения TRAIL, CRP и IP-10 в таких тканях и образцах.

Предпочтительно, уровень полипептидов измеряют в течение примерно 24 часов после получения образца. Альтернативно, концентрацию полипептидов измеряют в образце, который хранился при температуре 12°С или ниже, когда хранение начинается менее чем через 24 часа после получения образца.

После проведения тестов для определения уровня полипептидов необязательно генерируют специфичный для конкретного субъекта набор данных, который содержит результаты измерений.

Специфичный для конкретного субъекта набор данных может храниться в машиночитаемом формате на энергонезависимом машиночитаемом носителе и необязательно и предпочтительно анализироваться аппаратным обрабатывающим устройством, таким как компьютер общего назначения или выделенное устройство.

Как было указано ранее, уровни полипептидов в крови тестируемых субъектов сравнивают с уровнями идентичных полипептидов во множестве образцов крови субъектов, если субъекты уже были верифицированы в качестве имеющих бактериальную инфекцию, вирусную инфекцию или небактериальное/невирусное заболевание на основе параметров, отличных от уровней данных полипептидов в крови. Данные по уровням полипептидов множества субъектов совместно с их верифицированным диагнозом могут храниться во втором наборе данных, также называемом здесь "групповым набором данных" или "преддиагностическим набором данных", как описано ниже.

Термин "небактериальное/невирусное заболевание" означает заболевание, которое не вызывается бактерией или вирусом. Он включает заболевания, такие как острый инфаркт миокарда, физическая травма, эпилептический приступ, воспалительные расстройства и так далее, грибковые заболевания, паразитарные заболевания и так далее.

Термин "вирусная инфекция" в соответствии с используемым здесь значением означает заболевание, которое вызывается вирусом и не включает бактериальный компонент.

Способы анализа набора данных, например в целях вычисления одной или нескольких функций вероятностной классификации, отражающих вероятность того, что конкретный субъект имеет бактериальную инфекцию, или вероятность того, что конкретный субъект имеет вирусную инфекцию, или вероятность того, что конкретный субъект имеет небактериальное невирусное заболевания, могут быть осуществлены как описано в Примере 1 ниже. Например, диагноз может быть поддержан с применением диагностических анализов на основе ПЦР, таких как (i) Seeplex® RV15 для детектирования вируса парагриппа 1, 2, 3 и 4, коронавируса 229E/NL63, аденовируса A/B/C/D/E, бокавируса 1/2/3/4, вируса гриппа А и В, метапневмовируса, коронавируса ОС43, риновируса А/В/С, респираторно-синцитиального вируса А и В, и энтеровируса, или (ii) Seeplex® РВ6 для детектирования Streptococcus pneumoniae, Haemophilus influenzae, Chlamydophila pneumoniae, Legionella pneumophila, Bordetella pertussis и Mycoplasma pneumoniae.

Культуры, выделенные из крови, мочи и стула, могут быть проанализированы на Shigella spp., Campylobacter spp.и Salmonella spp.; серологическое тестирование (IgM и/или IgG) может быть проведено для анализа на цитомегаловирус (CMV), вирус Эпштейна-Барра (EBV), Mycoplasma Pneumonia и Coxiella burnetii (коксиеллез).

Радиологические тесты (например, рентгенография грудной клетки для субъектов с подозрением на наличие инфекции нижних дыхательных путей [LRTI]) могут применяться для подтверждения инфекций грудной клетки.

Альтернативно или дополнительно, по меньшей мере, один опытный лечащий врач может быть использован для постановки диагноза.

Способы определения уровня экспрессии полипептидов у субъектов перед диагностикой были описаны выше.

Предпочтительно, тот же способ, который применяется для определения уровня экспрессии полипептидов у субъектов перед диагностикой, применяется для определения уровня данных полипептидов у тестируемого субъекта. Таким образом, например, если способ иммуноаналитического типа применяется для определения уровня экспрессии полипептидов у субъектов перед диагностикой, то для определения уровня данных полипептидов у тестируемого субъекта должен применяться способ иммуноаналитического типа.

Очевидно, что тип образца крови не обязательно должен являться идентичным у тестируемого субъекта и субъектов перед диагностикой. Авторам настоящего изобретения удалось показать, что уровни TRAIL в сыворотке и плазме являются очень схожими. Таким образом, например, если образец сыворотки применяется для определения уровня экспрессии полипептидов у субъектов перед диагностикой, то для определения уровня данных полипептидов у тестируемого субъекта может применяться образец плазмы.

Групповой набор данных предпочтительно хранится в машиночитаемом формате на энергонезависимом машиночитаемом носителе и необязательно и предпочтительно анализируется аппаратным обрабатывающим устройством, таким как компьютер общего назначения или выделенное устройство. Оба набора данных могут храниться на одном носителе и необязательно и предпочтительно анализироваться одним аппаратным обрабатывающим устройством.

В специфичном по отношению к субъекту наборе данных каждая запись может быть необязательно и предпочтительно описана в виде кортежа (D, L), где D соответствует полипептиду в наборе данных, a L соответствует уровню полипептида D в крови. Таким образом, набор данных может представлять собой двумерный набор данных, в котором все элементы могут быть описаны вектором в двумерном пространстве, заполненном значениями названия полипептида и соответствующей величины реакции. В групповом наборе данных каждая запись может быть описана в виде кортежа (S, G, D, L), где S соответствует конкретному субъекту, G соответствует диагнозу субъекта S в групповом наборе данных, D соответствует полипептиду, a L соответствует уровню полипептида D в крови. Таким образом, приведенная в качестве примера иллюстрация представляет собой четырехмерный набор данных, в котором все элементы могут быть описаны вектором в четырехмерном пространстве, заполненном значениями имени субъекта, диагноза, полипептида и соответствующими величинами реакции. Некоторые варианты осуществления настоящего изобретения включают применение набора данных более высоких размерностей. Такие наборы данных описаны далее.

Групповой набор данных может также необязательно и предпочтительно включать один или несколько, более предпочтительно все, записи специфичного по отношению к субъекту набора данных. В вариантах осуществления, в которых групповой набор данных включает все записи специфичного по отношению к субъекту набора данных, не является обязательным применение двух отдельных наборов данных, поскольку весь набор данных содержится в одном общем наборе данных. Однако подобный общий набор данных необязательно и предпочтительно снабжен аннотациями, обеспечивающими возможность различения части общего набора данных, который связан с подвергаемым анализу субъектом, и части общего набора данных, которая связана только с другими субъектами. В контексте настоящего описания часть общего набора данных, которая связана с подвергаемым анализу субъектом, называется специфичным по отношению к субъекту набором данных, даже если она не представлена в виде отдельного набора данных. Аналогичным образом, часть общего набора данных, которая связана только с другими субъектами, называется групповым набором данных, даже если она не представлена в виде отдельного набора данных.

Групповой набор данных предпочтительно включает значения уровней полипептидов у многих субъектов (например, по меньшей мере, 10 субъектов, у которых была предварительно диагностирована вирусная инфекция; по меньшей мере, 10 субъектов, у которых была предварительно диагностирована бактериальная инфекция; и, по меньшей мере, 10 субъектов, у которых было предварительно диагностировано небактериальное/невирусное заболевание; или, по меньшей мере, 20 субъектов, у которых была предварительно диагностирована вирусная инфекция; по меньшей мере, 20 субъектов, у которых была предварительно диагностирована бактериальная инфекция; и, по меньшей мере, 20 субъектов, у которых было предварительно диагностировано небактериальное/невирусное заболевание; или, по меньшей мере, 50 субъектов, у которых была предварительно диагностирована вирусная инфекция; по меньшей мере, 50 субъектов, у которых была предварительно диагностирована бактериальная инфекция; и, по меньшей мере, 50 субъектов, у которых было предварительно диагностировано небактериальное/невирусное заболевание).

Специфичный по отношению к группе набор данных может включать дополнительные данные, которые описывают субъектов. Наборы данных, которые включают дополнительные данные, могут обеспечивать преимущество, поскольку они обеспечивают дополнительную информацию в плане аналогий между подвергаемым анализу субъектом и другим субъектом, тем самым повышая точность прогнозирования.

Соответствующие примеры типов данных, отличных от уровня полипептидов, включают, без ограничения, традиционные лабораторные факторы риска и/или клинические параметры, как описано выше.

Настоящие варианты осуществления изобретения включают специфические по отношению к субъекту и группе наборы данных, которые включают дополнительные данные помимо уровней полипептидов и величин реакций. В некоторых вариантах осуществления, по меньшей мере, один из наборов данных включает одну или несколько (например, множество) многомерных записей, при этом каждая запись имеет, по меньшей мере, три измерения, при этом в некоторых вариантах осуществления, по меньшей мере, один из наборов данных включает одну или несколько (например, множество) многомерных записей, при этом каждая запись имеет, по меньшей мере, четыре измерения, в некоторых вариантах осуществления, по меньшей мере, один из наборов данных включает одну или несколько (например, множество) многомерных записей, при этом каждая запись имеет, по меньшей мере, пять измерений, и в некоторых вариантах осуществления, по меньшей мере, один из наборов данных включает одну или несколько (например, множество) многомерных записей, при этом каждая запись имеет более пяти измерений.

Дополнительные измерения наборов данных обеспечивают дополнительную информацию, относящуюся к подвергаемому анализу субъекту, другим субъектам и/или уровням полипептидов, отличных от TRAIL, CRP и IP-10.

В некоторых вариантах осуществления настоящего изобретения дополнительная информация относится, по меньшей мере, к одному из традиционных лабораторных факторов риска, клиническим параметрам, биохимическим показателям крови и/или генетическому профилю.

Термин "традиционные лабораторные факторы риска" охватывает биомаркеры, выделенные или полученные из образцов субъекта, которые в настоящее время анализируются в клинической лаборатории и применяются в рамках традиционных глобальных алгоритмах оценки риска, таких как абсолютное количество нейтрофилов (обозначается как ANC), абсолютное количество лимфоцитов (обозначается как ALC), количество белых кровяных клеток (обозначается как WBC), % нейтрофилов (определен как доля белых кровяных клеток, представляющих собой нейтрофилы; обозначается как Neu (%)), % лимфоцитов (определен как доля белых кровяных клеток, представляющих собой лимфоциты; обозначается как Lym (%)), % моноцитов (определен как доля белых кровяных клеток, представляющих собой моноциты; обозначается как Mon (%)), натрий (обозначается как Na), калий (обозначается как K), билирубин (обозначается как Bili).

Предпочтительно, по меньшей мере, один из традиционных лабораторных факторов риска подвергаемого анализу субъекта включен в специфичный по отношению к субъекту набор данных, при этом, по меньшей мере, один из традиционных лабораторных факторов риска одного или нескольких (более предпочтительно - всех) других субъектов включен в групповой набор данных. Если специфичный по отношению к субъекту набор данных включает, по меньшей мере, один из традиционных факторов риска, то факторы риска могут быть включены в виде отдельной записи. Если групповой набор данных включает факторы риска, то факторы риска необязательно и предпочтительно включены для каждого субъекта. Таким образом, например, запись в групповом наборе данных может быть описана кортежем (S, G, D, L {R}), где S, G, D и L были введены ранее, a {R} представляет собой, по меньшей мере, один фактор риска субъекта S.

Термин "клинические параметры" охватывает все не относящиеся к образцам или аналитам биомаркеры состояния здоровья субъекта или иные характеристики, такие как, без ограничения, возраст (Age), раса (RACE), пол (Sex), температура тела (обозначается как "temperature"), максимальная температура тела с момента первоначального проявления симптомов (обозначается как "maximal temperature"), время с первоначального проявления симптомов (обозначается как "time from symptoms"), беременность или семейная история (обозначается как "FamHX").

Предпочтительно, по меньшей мере, один из клинических параметром подвергаемого анализу субъекта включен в специфичный по отношению к субъекту набор данных и, по меньшей мере, один из клинических параметров одного или нескольких (предпочтительно - всех) других субъектов включен в групповой набор данных. Если специфичный по отношению к субъекту набор данных включает, по меньшей мере, один из клинических параметров, то клинические параметры могут быть включены в виде отдельной записи. Если групповой набор данных включает клинические параметры, то клинические параметры необязательно и предпочтительно включены в расчете на отдельного субъекта. Таким образом, например, запись в групповом наборе данных может быть описана кортежем (S, G, D, L {С}), где S, G, D и L были введены ранее, а {С} представляет собой клинический параметр субъекта S.

В соответствии с используемым здесь значением, термин "биохимические показатели крови" означает концентрацию или концентрации любого и всех веществ, растворенных или содержащихся в крови. Соответствующие примеры таких веществ включают, без ограничения, альбумин, амилазу, щелочную фосфатазу, бикарбонат, общий билирубин, BUN (азот в составе мочевины в крови), С-реактивный белок, кальций, хлорид, LDL (липопротеины низкой плотности), HDL (липопротеины высокой плотности), общий холестерин, креатинин, СРК (креатинкиназу), γ-GT (гамма-глютаминтаурин), глюкозу, LDH (лактатдегидрогеназу), неорганический фосфор, липазу, калий, общий белок, AST (аспартатаминотрансферазу), ALT (аланинаминотрансферазу), натрий, триглицериды, мочевую кислоту и VLDL (липопротеины очень низкой плотности).

В соответствии с одним вариантом осуществления, биохимические показатели крови подвергаемого анализу субъекта включены в специфичный по отношению к субъекту набор данных, при этом биохимические показатели крови одного или нескольких (более предпочтительно - всех) других субъектов включены в групповой набор данных. Если специфичный по отношению к субъекту набор данных включает биохимические показатели крови, то биохимические показатели крови могут быть включены в виде отдельной записи. Если групповой набор данных включает биохимические показатели крови, то биохимические показатели крови необязательно и предпочтительно включены для каждого субъекта. Таким образом, например, запись в групповом наборе данных может быть описана кортежем (S, G, D, L {С}), где S, G, D и L были введены ранее, а {С} представляет собой биохимические показатели крови субъекта S.

В некоторых вариантах осуществления настоящего изобретения дополнительная информация относится к генетическому профилю субъекта.

В соответствии с используемым здесь значением, термин "генетический профиль" означает анализ ряда различных генов. Генетический профиль может включать гены из всего генома субъекта или может включать отдельное подмножество генов. Генетический профиль может включать геномный профиль, протеомный профиль, эпигеномный профиль и/или транскриптомный профиль.

Предпочтительно, генетический профиль подвергаемого анализу субъекта включен в специфичный по отношению к субъекту набор данных, при этом генетический профиль одного или нескольких (более предпочтительно - всех) других субъектов включен в групповой набор данных. Если специфичный по отношению к субъекту набор данных включает генетический профиль, то генетический профиль может быть включен в виде отдельной записи. Если групповой набор данных включает генетический профиль, то генетический профиль необязательно и предпочтительно включен для каждого субъекта. Таким образом, например, запись в групповом наборе данных может быть описана кортежем (S, G, D, L {Р}), где S, G, D и L были введены ранее, а {Р} представляет собой генетический профиль субъекта S.

Способ необязательно и предпочтительно продолжается до этапа хранения значений уровней полипептида, по меньшей мере, временно, на энергонезависимом машиночитаемом носителе, из которого он может быть извлечен или отображен необходимым образом.

После анализа двух наборов данных способ продолжается до фазы анализа в целях определения диагноза тестируемого субъекта.

Анализ осуществляется с целью вычисления одной или нескольких функций вероятностной классификации f(δ01), g(δ01), h(δ01), отражающих вероятности того, что конкретный субъект имеет бактериальную инфекцию, вирусную инфекцию или невирусное небактериальное заболевание, соответственно. Как правило, f, g и h удовлетворяют условию f(δ01)+g(δ01)+h(δ01)=1. Каждая функция классификационная функция представляет собой функцию первой координаты δ0 и второй координаты δ1, при этом каждая из координат δ0 и δ1 определена различной комбинацией значений экспрессии, как описано выше.

Анализ может осуществляться более чем одним способом.

В соответствии с одним вариантом осуществления в рамках анализа применяется двоичный или, более предпочтительно, троичный классификатор для вычисления одного или нескольких функций вероятностной классификации.

Предпочтительно, в рамках анализа осуществляется сложение вероятности вирусного и невирусного небактериального заболевания с целью присвоения значения вероятности небактериальной инфекции. В другом предпочтительном варианте осуществления в рамках анализа осуществляется сложение вирусной и бактериальной инфекции с целью присвоения значения вероятности инфекционному заболеванию. В другом предпочтительном варианте осуществления в рамках анализа игнорируется вероятность невирусного небактериального заболевания и осуществляется непосредственное сравнение вероятностей бактериального и вирусного заболевания. Примеры интерпретационных функций, являющихся подходящими для анализа наборов данных в соответствии с некоторыми вариантами осуществления настоящего изобретения, приведены ниже.

Анализ наборов данных в соответствии с некоторыми вариантами осуществления настоящего изобретения включает выполнение процедуры машинного обучения.

В соответствии с используемым здесь значением, термин "машинное обучение" означает процедуру, реализованную в виде компьютерной программы, сконфигурированной для индуцирования паттернов, регулирующих условий или правил на основе ранее собранных данных для разработки подходящей реакции на будущие данные или описания данных в определенном осмысленном виде.

Применение машинного обучения является особенно, но не исключительно, полезным, если набор данных включает многомерные записи.

Групповые и специфичные по отношению к отдельным субъектам наборы данных могут применяться в качестве тренировочного набора, на основе которого процедура машинного обучения может извлекать параметры, которые описывают набор данных наилучшим образом. После извлечения параметров они могут применяться для прогнозирования типа инфекции.

При машинном обучении информация может быть получена путем обучения с учителем или обучения без учителя. В некоторых вариантах осуществления изобретения процедура машинного обучения включает или состоит из процедуры обучения с учителем. При обучении с учителем применяются функции достижения глобальных или локальных целей для оптимизации структуры обучающейся системы. Другими словами, при обучении с учителем существует желаемая реакция, которая применяется системой для направления процесса обучения.

В некоторых вариантах осуществления изобретения процедура машинного обучения включает или состоит из процедуры обучения без учителя. При обучении без учителя целевые функции обычно отсутствуют. В частности, система обучения не включает набора правил. Одна форма обучения без учителя в соответствии с некоторыми вариантами осуществления настоящего изобретения представляет собой кластеризацию без учителя, при которой объекты данных не помечаются как относящиеся к определенным классам a priori.

Соответствующие примеры процедур "машинного обучения" являющихся подходящими для настоящих вариантов осуществления изобретения включают, без ограничения, кластеризацию, алгоритмы на основе правил ассоциирования, алгоритмы анализа признаков, алгоритмы выбора подмножеств, методы опорных векторов, классификационные правила, обучение с неодинаковыми издержками неправильной классификации, избирательные алгоритмы, объединительные алгоритмы, байесовские сети, деревья решений, нейронные сети, алгоритмы обучения на основе множественных способов, вероятностные модели, графические модели, способы на основе логистической регрессии (включая способы на основе полиномиальной логистической регрессии), способы на основе градиентного подъема, способы на основе разложения по сингулярным числам матрицы и метод главных компонент. Среди моделей нейронных сетей самоорганизующаяся карта и теория адаптивного резонанса являются наиболее часто используемыми алгоритмами обучения без учителя. Модель на основе теории адаптивного резонанса обеспечивает вариативность ряда кластеров в зависимости от величины задачи и позволяет пользователю контролировать степень сходства между членами одних и тех же кластеров с помощью определяемой пользователем константы, называемой параметром бдительности.

Далее следует обзор некоторых процедур машинного обучения, подходящих для настоящих вариантов осуществления изобретения.

Алгоритм ассоциативного правила представляет собой способ выделения значимых ассоциативных паттернов среди признаков.

Термин "ассоциация" в контексте машинного обучения означает любую взаимосвязь между признаками, а не только те из них, которые позволяют прогнозировать конкретный класс или числовое значение. Ассоциация включает, без ограничения, определение ассоциативных правил, определение паттернов, осуществление анализа признаков, осуществление отбора подмножества признаков, разработку прогностических моделей и понимание взаимодействий между признаками.

Термин "ассоциативные правила" означает элементы, которые часто совместно встречаются в наборах данных. Он включает, без ограничения, ассоциативные паттерны, дифференциальные паттерны, частотные паттерны, закрытые паттерны и колоссальные паттерны.

Обычным первичным этапом алгоритма ассоциативных правил является определение набора элементов или признаков, которые являются наиболее часто встречающимися среди всех наблюдений. После получения перечня на их основе могут быть получены правила.

Вышеуказанная самоорганизующаяся карта представляет собой способ обучения без учителя, который часто применяется для визуализации и анализа данных высокой размерности. Традиционные виды применения связаны с визуализацией центральных зависимостей в рамках данных на карте. Карта генерируется алгоритмом, который может применяться для ускорения идентификации ассоциативных правил с применением других алгоритмов. Данный алгоритм обычно включает сеть из обрабатывающих элементов, называемых "нейронами". Каждый нейрон ассоциирован с характеристическим вектором, называемым наблюдением. Карта пытается отразить все доступные наблюдения с оптимальной точностью с применением ограничивающего набора моделей. В то же время модели становятся упорядоченными в рамках сети, таким образом что похожие модели расположены ближе друг к другу, а непохожие модели расположены далеко друг от друга. Данная процедура обеспечивает идентификацию, а также визуализацию зависимостей или ассоциаций между признаками в рамках данных.

Алгоритмы анализа признаков направлены на ранжирование признаков или ранжирование с последующим отбором признаков на основе их влияния.

Термин "признак" в контексте машинного обучения означает одну или несколько необработанных входных переменных, одну или несколько обработанных переменных, или одну или несколько математических комбинаций других переменных, включая необработанные переменные и обработанные переменные. Признаки могут являться непрерывными или дискретными.

Прирост информации представляет собой один из способов машинного обучения, подходящий для анализа признаков. Определение прироста информации требует определения энтропии, которая представляет собой степень неоднородности в наборе элементов для тренировки. Снижение энтропии целевого признака, которое осуществляется благодаря знанию значений определенного признака, называют приростом информации. Прирост информации может применяться в качестве параметра для определения эффективности признака при определении типа инфекции. Симметрическая неопределенность представляет собой алгоритм, который может применяться в рамках алгоритма отбора признаков в соответствии с некоторыми вариантами осуществления настоящего изобретения. Симметрическая неопределенность компенсирует предвзятость вследствие прироста информации в пользу признаков с количеством значений путем нормализации признаков в рамках диапазона [0, 1].

Алгоритмы отбора подмножеств основаны на комбинации алгоритма анализа и алгоритма поиска. Аналогично алгоритмам анализа признаком алгоритмы отбора подмножеств включают ранжирование подмножеств признаков. Однако в отличие от алгоритмов анализа признаков алгоритм отбора подмножеств, подходящий для настоящих вариантов осуществления изобретения, нацелен на отбор подмножества признаков с наиболее сильным влиянием на тип инфекции одновременно с учетом степени статистической неопределенности между признаками, включенными в подмножество. Преимущества, связанные с отбором подмножества признаков, включают обеспечение визуализации данных и понимание, снижение требований к условиям измерения и хранения, снижение продолжительности тренировки и применения, и устранение отвлекающих признаков для улучшения классификации.

Двумя основными подходами к алгоритмам отбора подмножеств являются процесс добавления признаков к рабочему подмножеству (прямой отбор) и удаление признаков из текущего подмножества (обратное удаление). В машинном обучении прямой отбор осуществляется иным образом, чем статистическая процедура с тем же названием. В рамках машинного обучения добавляемый в текущее подмножество признак определяется путем анализа эффективности текущего подмножества, дополненного одним новым признаком, с применением перекрестной проверки. При прямом отборе подмножества формируются путем добавления каждого оставшегося признака в текущее подмножество при анализе ожидаемой эффективности каждого нового подмножества с применением перекрестной проверки. Приводящий к достижению наилучшей эффективности при добавлении к текущему подмножеству признак сохраняется и процесс продолжается. Поиск останавливается, когда ни один из оставшихся доступных признаков не улучшает прогностическую способность текущего подмножества. Данный процесс обеспечивает нахождение набора признаков локального оптимума.

Обратное удаление реализуется аналогичным образом. При обратном удалении поиск останавливается, когда дальнейшее удаление признаков из набора не повышает прогностическую способность подмножества. Настоящие варианты осуществления изобретения охватывают алгоритмы поиска, при которых осуществляется прямой поиск, обратный поиск или поиск в обоих направлениях. Соответствующие примеры алгоритмов поиска, которые могут применяться в рамках настоящих вариантов осуществления изобретения, включают, без ограничения, полный перебор, жадный алгоритм поиска с восхождением к вершине, случайные возмущения подмножеств, оберточные алгоритмы выбора признаков, поиск на основе гонки вероятностей, поиск на основе схем, поиск на основе гонки рангов и байесовский классификатор.

Дерево решений представляет собой алгоритм поддержки решений, который образует логическую последовательность этапов, связанных с анализом входных данных для принятия решения.

Термин "дерево решений" означает любой тип алгоритмов обучения на основе деревьев, включая, без ограничения, деревья в качестве моделей, классификационные деревья и деревья регрессии.

Дерево решений может применяться для классификации наборов данных или их связей иерархическим образом. Дерево решений имеет структуру дерева, которое включает узлы-"ветви" и узлы-"листья". Каждый узел-"ветвь" определяет атрибут (сплит-атрибут) и тест (сплит-тест) для осуществления в отношении значения сплит-атрибута и связан с другими узлами для всех возможных конечных результатов сплит-теста. Узел-ветвь, который представляет собой корень дерева решений, называют корневым узлом. Каждый узел-"лист" может соответствовать классификации (например, тому, является ли конкретная часть группового набора данных совпадающей с конкретной частью специфичного по отношению к субъекту набора данных) или значению. Узлы-"листья" также могут содержать дополнительную информацию о соответствующей классификации, такую как доверительный балл, который соответствует доверительности соответствующей классификации (например, вероятности того, что классификация является точной). Например, доверительный балл может представлять собой непрерывное значение от 0 до 1, при этом равный 0 балл указывает на очень малую доверительность (например, индикативное значение соответствующей классификации является очень низким), а равный 1 балл указывает на очень высокую доверительность (например, соответствующая классификация является практически наверняка точной).

Методы опорных векторов представляют собой алгоритмы, которые основаны на теории статистического обучения. Метод опорных векторов (SVM) в соответствии с некоторыми вариантами осуществления настоящего изобретения могут применяться для классификационных целей и/или для численного прогнозирования. Метод опорных векторов для классификации называют здесь "классификатором на основе метода опорных векторов", а метод опорных векторов для численного прогнозирования называют здесь "регрессией на основе метода опорных векторов".

SVM обычно характеризуется ядерной функцией, выбор которой определяет, будет ли полученный SVM обеспечивать классификацию, регрессию и другие функции. В рамках применения ядерной функции SVM обеспечивает маппинг входных векторов в высокоразмерное пространство признаков, в котором может быть сконструирована гиперповерхность для принятия решений (также известная как разделитель) для обеспечения классификации, регрессии или других связанных с принятием решений функций. В самом простом случае поверхность представляет собой гиперплоскость (также известную как линейный разделитель), однако более комплексные разделители также включены в объем изобретения и могут применяться с использованием ядерных функций. Точки данных, которые определяют гиперповерхность, называют опорными векторами.

Классификатор на основе метода опорных векторов обеспечивает выбор разделителя в участке, где расстояние до разделителя от наиболее близких точек данных является максимально большим, таким образом отделяя точки векторов признаков, связанные с объектами внутри рамках класса, от точек векторов признаков, связанных с объектами вне класса. Для реализации регрессии на основе метода опорных векторов конструируют трубку высокой размерности с радиусом, соответствующим величине приемлемой ошибки, которая минимизирует ошибку в наборе данных с одновременной максимизацией плоскостности связанной кривой или функции. Другими словами, трубка представляет собой "обертку" вокруг аппроксимированной кривой, образованной набором точек данных, являющихся ближайшими к данной кривой или поверхности.

Преимущество метода опорных векторов заключается в том, что после идентификации опорных векторов остальные наблюдения могут быть устранены из вычислений, что значительно снижает степень вычислительной сложности проблемы. SVM обычно включает две фазы: фазы тренировки и фазы тестирования. В рамках фазы тренировки генерируют набор опорных векторов для применения при реализации правила принятия решений. В рамках фазы тестирования осуществляется принятие решений с применением правила принятия решений. Алгоритм на основе опорных вектором представляет собой способ тренировки SVM. Путем реализации алгоритма генерируется тренировочный набор параметров, включая опорные векторы, которые характеризуют SVM. Соответствующий пример алгоритма опорных векторов, подходящих для настоящих вариантов осуществления изобретения включает, без ограничения, последовательную минимальную оптимизацию.

Способы на основе регрессии, которые могут применяться в соответствии с настоящим изобретением, включают, без ограничения, линейную регрессию, множественную регрессию, логистическую регрессию, регрессию на основе пробитое, порядковую логистическую регрессию, порядковую регрессию на основе пробитое, пуассоновскую регрессию, отрицательную биномиальную регрессию, полиномиальную логистическую регрессию (MLR) и усеченную регрессию.

Логистическая регрессия или логит-регрессия представляет собой тип регрессионного анализа, применяемый для прогнозирования конечной величины зависимой распределенной по категориям переменной (зависимой переменной, которая может иметь ограниченное количество значений, чьи величины не являются значимыми, но чей порядок величин может являться или не являться значимым) на основе одной или нескольких прогностических переменных. Логистические регрессии также включают полиномиальный вариант.Модель на основе полиномиальной логистической регрессии представляет собой модель на основе регрессии, которая обобщает логистическую регрессию путем обеспечения возможности наличия более чем двух дискретных конечных значений. Таким образом, она представляет собой модель, которая применяется для прогнозирования вероятностей различных возможных конечных значений распределенной по категориям зависимой переменной с учетом набора независимых переменных (которые могут иметь реальные значения, бинарные значения, соответствующие категориям значения и так далее).

Преимущество логистической регрессии заключается в том, что она обеспечивает определение интерпретируемой величины степени прогностической доверительности - вероятности. Например, пациенты, у которых прогнозируется наличие бактериальной инфекции с вероятностью 75% и 99%, будут отнесены к имеющим бактериальную инфекции при применении интерпретационной функции на основе SVM, однако факт того, что последние из них имеют более высокую вероятность ее наличия, будет скрыт.Определение уровня вероятности степени доверительности добавляет ценную клиническую информацию, которая может повлиять на вынесение клинических решений.

Важно, что вычисление вероятности типа инфекции для каждого пациента позволяет рационально исключать пациентов, для которых система знает о своей неспособности осуществлять классификацию с высокой уверенностью. Это продемонстрировано здесь на Фиг. 5. Таким образом, продукт позволяет определять, например, 40% вероятность бактериальной инфекции (40 из 100 пациентов со значением балла "40%" будут иметь бактериальную инфекцию).

Дополнительно, благодаря применению пороговых значений в отношении баллов вероятности, является возможным осуществлять недвоичную классификацию тестируемого субъекта. Например, у тестируемого субъекта с вероятностью бактериальной инфекции ниже 30% может быть определена низкая вероятность бактериальной инфекции; от 30% до 70% - средняя вероятность бактериальной инфекции, а свыше 70% - высокая вероятность бактериальных инфекций. Могут применяться и другие пороговые значения.

Алгоритм LASSO (способ оценки параметров линейной модели с возможностью уменьшения размерности) представляет собой алгоритм для уменьшения размерности и/или отбора для линейной регрессии. Алгоритм LASSO может обеспечивать минимизирование обычной суммы квадратичных ошибок с регуляризацией, которая может представлять собой L1-регуляризацию (ограничение суммы абсолютных значений коэффициентов), L2-регуляризацию (ограничение суммы квадратов коэффициентов) и им подобные. Алгоритм LASSO может быть связан с мягкой пороговой классификацией вейвлет коэффициентов, прямой пошаговой регрессией и способами бустинга. Алгоритм LASSO описан в публикации Tibshirani, R, Regression Shrinkage and Selection via the Lasso, J. Royal. Statist. Soc В., т.58, №. 1, 1996, стр. 267-288, содержание которой приведено здесь для ссылки.

Байесовская сеть представляет собой модель, которая соответствует переменным и условным взаимозависимостям между переменными. В байесовской сети переменные представлены в виде узлов, при этом узлы могут быть соединены друг с другом с помощью одного или нескольких соединений. Соединение указывает на связь между двумя узлами. Узлы обычно имеют соответствующие таблицы условных вероятностей, которые применяются для определения вероятности состояния узла с учетом состояния других узлов, с которыми соединен данный узел. В некоторых вариантах осуществления изобретения применяется алгоритм на основе оптимального байесовского классификатора для использования максимальной апостериорной гипотезы в отношении новой записи для прогнозирования вероятности ее классификации, а также для вычисления вероятностей на основе всех остальных гипотез, полученных на основе тренировочного набора, и для применения данных вероятностей в качестве весовых факторов для будущих предсказаний типа инфекции. Алгоритм, являющийся подходящим для поиска наилучшей байесовской сети, включает, без ограничения, алгоритм на основе метрики общего балла. В рамках альтернативного подхода к формированию сети может применяться марковское покрытие. Марковское покрытие заключается в изолировании узла от влияния любого узла вне его границы, которая состоит из элементов-родителей узла, его элементов-детей и элементов-родителей его элементов-детей.

Алгоритмы на основе экземпляров позволяют генерировать новую модель для каждого экземпляра вместо осуществления прогнозирования на основе деревьев или сетей, полученных (ранее) на основе тренировочного набора.

Термин "экземпляр" в контексте машинного обучения означает пример из набора данных.

Алгоритмы на основе экземпляров обычно включают хранение всего набора данных в памяти и построение модели на основе набора записей, сходных тем, которые подвергаются тестированию. Данное сходство может быть проанализировано, например, с помощью методов ближайшего соседа или локально взвешенных регрессий, например с применением евклидовых расстояний. После выбора набора записей конечная модель может быть построена с применением нескольких различных алгоритмов, таких как наивные байесовские классификаторы.

Настоящее изобретение также может применяться для скрининга подгрупп пациентов или субъектов в плане любых условий. Например, в рамках здравоохранительной организации, медицинского учреждения или школьной здравоохранительной программы может осуществляться скрининг группы субъектов для идентификации тех из них, которым требуются вмешательства, как описано здесь, или для сбора эпидемиологических данных. Страховые компании (например, предлагающие страхование здоровья, жизни или инвалидности) могут подвергать клиентов скрининга в рамках процесса определения покрываемых страховых случаев или стоимости или существующих клиентов для возможного вмешательства. Данные, собранные в рамках подобных анализов групп субъектов, особенно совместно с любым клиническим прогрессированием таких состояний, как инфекция, будут являться ценными в плане работы, например, здравоохранительных организаций, общественных здравоохранительных программ или страховых компаний. Подобные наборы данных или коллекции могут храниться на машиночитаемых носителях и применяться в рамках любых систем для управления связанными с состоянием здоровья данными для предоставления улучшенных медицинских услуг, оптимизации стоимости медицинских услуг, улучшения условий страхования и так далее. См., например, См., например, заявку на патент США 2002/0038227; заявку на патент США 2004/0122296; заявку на патент США 2004/ 0122297; и патент США 5018067. Подобные системы могут иметь доступ к данным непосредственно из внутреннего хранилища данных или удаленно из одного или нескольких мест для хранения данных, как описано ниже.

Машиночитаемый носитель для хранения данных может включать связанный с хранением данных материал, кодируемый машиночитаемыми данными или массивами данных, который при применении устройства, запрограммированного с применением инструкций для использования указанных данных, может применяться для ряда целей. Измерения эффективных количеств биомаркеров по изобретению и/или анализ риска, обусловленного данными биомаркерами, может быть реализован в рамках компьютерных программ, выполняемых на программируемых компьютерах, включающих, помимо прочего, процессор, систему хранения данных (включая энергозависимую и энергонезависимую память и/или элементы для хранения данных), по меньшей мере, одно устройство для ввода и, по меньшей мере, одно устройство для вывода.

Программный код может применяться для ввода данных для реализации описанных выше функций и генерации выходной информации. Выходная информация может подаваться на одно или несколько устройств вывода в соответствии со способами, которые известны из уровня техники. Компьютер может представлять собой, например, персональный компьютер, микрокомпьютер или рабочую станцию стандартного вида.

Каждая программа может быть реализована на высокоуровневом процедурном или объектно-ориентированном языке программирования для взаимодействия с компьютерной системой. Тем не менее, программы могут быть реализованы на ассемблере или машинном языке, если это требуется. Язык может представлять собой компилируемый или интерпретируемый язык. Каждая подобная компьютерная программа может храниться на носителях данных или устройстве (например, в ROM или на магнитной дискете или других носителях, как описано в других частях данного описания), читаемом программируемым компьютером общего или специального назначения для конфигурирования и работы компьютера при чтении носителей данных или устройства компьютером для реализации описанных здесь процедур.

Система управления связанными с состоянием здоровья данными по изобретению также может рассматриваться в качестве реализованной в виде машиночитаемого носителя данных, сконфигурированного с применением компьютерной программы, при этом носитель данных, сконфигурированный подобным образом, заставляет компьютер работать специальным и предварительно определенным образом для реализации различных описанных здесь функций.

Записываемые выходные данные могут включать результаты анализов, выводы, диагнозы, прогнозы и/или рекомендации по лечению. Они могут передаваться, например, техническим специалистам, лечащим врачам и/или пациентам. В определенных вариантах осуществления компьютеры будут применяться для передачи подобной информации заинтересованным сторонам, таким как пациенты и/или лечащие врачи. Терапия, вводимая субъекту, может быть модифицирована на основе выходных данных.

В одном варианте осуществления выходные данные представлены в графическом виде. В другом варианте осуществления выходные данные представлены в числовом виде (например, в виде вероятности). В другом варианте осуществления выходные данные генерируются с применением значения цвета (например, в рамках дисплея со шкалой), при этом один цвет указывает на наличие бактериальной инфекции, а другой цвет - на наличие небактериальной инфекции. Интенсивность цвета коррелирует с вероятностью наличия бактериальной инфекции/отсутствия инфекции. Подобный графический дисплей представлен на Фиг. 29А-F.

В некоторых вариантах осуществления выходные данные передаются субъекту как можно скорее после завершения анализа и генерирования диагноза и/или прогноза. Результаты и/или связанная информация могут быть переданы субъекту лечащим врачом субъекта. Альтернативно, результаты могут быть переданы непосредственно тестируемому субъекту с помощью коммуникационных средств, включая письменные, например путем предоставления письменного отчета, электронных форм коммуникаций, таких как электронная почта, и с помощью телефона. Передача может осуществляться путем применения компьютера, например в случае передачи по электронной почте. В определенных вариантах осуществления коммуникация, содержащая результаты диагностического теста и/или заключения на их основе и/или рекомендации по лечению, основанные на тесте, могут быть сгенерированы и доставлены автоматически субъекту с применением комбинации компьютерного аппаратного обеспечения и программного обеспечения, которое знакома специалистам в области телекоммуникаций. Один пример коммуникационной системы для применения в области здравоохранения описан в патенте США 6283761; тем не менее, настоящее изобретение не ограничивается способами, в рамках которых применяется данная конкретная коммуникационная система. В определенных вариантах осуществления способов изобретения все или некоторые из этапов способа, включая анализ образцов, диагностику заболеваний и передачу результатов анализов или диагностики, могут быть осуществлены в различных (например, зарубежных) юрисдикциях.

В некоторых вариантах осуществления описанные здесь способы реализуются с применением системы 330, которая необязательно и предпочтительно, но не обязательно, включает карманное устройство, которое включает, по меньшей мере, две части: первую, которая обеспечивает измерение количества полипептидов в крови (например, с применением иммуногистохимического способа), и вторую, которая проводит вычислительный анализ результатов, измеренных первой частью, и генерирует выходные данные, относящиеся к диагнозу.

Блок-схема соответствующего примера системы 330 в соответствии с некоторыми вариантами осуществления настоящего изобретения приведена на Фиг. 34. Система 330 может включать устройство 331, которое может представлять собой, но необязательно, карманное устройство. Альтернативно, устройство 331, которое может представлять собой устройство, которое монтируется или размещается на столе. Система 330 может включать первую часть 332 с измерительной системой 333, сконфигурированной для измерения значения экспрессии полипептидов в крови субъекта. Измерительная система 333 может выполнять, по меньшей мере, один вид автоматизированного анализа, выбранный из группы, состоящей из автоматизированного анализа ELISA, автоматизированного иммуноанализа и автоматизированного функционального анализа. Система 330 также может включать вторую часть 334, включающую аппаратное обрабатывающее устройство 336 с машиночитаемым носителем данных 338 для хранения инструкций компьютерной программы для выполнения описанных здесь операций (например, инструкций компьютерной программы для определения первой и/или второй координаты, инструкций компьютерной программы для определения кривой и/или плоскости, инструкций компьютерной программы для вычисления первого и/или второго расстояния, инструкции компьютерной программы для коррелирования вычисленной дистанции (дистанций) с присутствием, отсутствием или вероятностью того, что субъект имеет бактериальную и/или вирусную инфекцию). Аппаратное обрабатывающее устройство 336 сконфигурировано для получения результатов измерений значений экспрессии из первой части 332 и выполнения программных инструкций в ответ на данные результаты. Необязательно и предпочтительно аппаратное обрабатывающее устройство 336 также сконфигурировано для вывода обработанных данных на устройство для отображения 340.

В некоторых необязательных вариантах осуществления настоящего изобретения система 330 соединена с коммуникационной сетью. В данных вариантах осуществления система 330 или аппаратное обрабатывающее устройство 336 включает сетевой интерфейс 350, который соединен с коммуникационной сетью 352. На соответствующей иллюстрации, приведенной на Фиг. 34, сеть 352 применяется для передачи результатов анализа, осуществленного аппаратным обрабатывающим устройством 336 (например, наличия, отсутствия или вероятности того, что субъект имеет бактериальную и/или вирусную инфекцию) в одно или несколько удаленных мест. Например, система 330 может передавать результаты анализа, по меньшей мере, одной лабораторной информационной системе 360, и/или центральному серверу 362, который собирает данные от множества систем, подобных системе 330.

Фиг. 39А представляет собой схематичную иллюстрацию, показывающую блок-схему системы 330 в вариантах осуществления, в рамках которых коммуникационная сеть 352 применяется для получения результатов измерения значений экспрессии. В рамках данных вариантов осуществления система 330 может включать машиночитаемый носитель 338, как описано выше, и аппаратное обрабатывающее устройство, такое как, но без ограничения, обрабатывающее устройство 336. Аппаратное обрабатывающее устройство 336 может включать сетевой интерфейс 350. Через интерфейс 350 аппаратное обрабатывающее устройство 336 получает результаты измерения значений экспрессии от измерительной системы, такой как, без ограничения, измерительная система 333, и выполняет компьютерные программные инструкции с машиночитаемого носителя 338 в ответ на полученные результаты измерений. Аппаратное обрабатывающее устройство 336 затем может выводить обработанные данные на устройство для отображения 340.

Изобретение также включает комбинации вариантов осуществления, показанных на Фиг. 34 и 39А. Например, интерфейс 350 может применяться как для получения результатов измерения значений экспрессии из сети 352, так и для передачи результатов анализа через сеть 352.

В некоторых вариантах осуществления настоящего изобретения система 330 взаимодействует с пользователем, как схематически показано на блок-схеме на Фиг. 39 В. В рамках данных вариантов осуществления система 330 может включать машиночитаемый носитель 338, как описано выше, и аппаратное обрабатывающее устройство, такое как, но без ограничения, обрабатывающее устройство 336. Аппаратное обрабатывающее устройство 336 включает пользовательский интерфейс 354, который взаимодействует с пользователем 356. Через интерфейс 350 аппаратное обрабатывающее устройство 336 получает результаты измерения значений экспрессии от пользователя 356. Пользователь 356 может получать значение экспрессии из внешнего источника или путем выполнения, по меньшей мере, одного анализа, выбранного из группы, состоящей из иммуноанализа и функционального анализа, или с помощью операционной системы 333 (не показана, см. Фиг. 39А и 34). Аппаратное обрабатывающее устройство 336 выполняет компьютерные программные инструкции с машиночитаемого носителя 338 в ответ на полученные результаты измерений. Аппаратное обрабатывающее устройство 336 затем может выводить обработанные данные на устройство для отображения 340.

Очевидно, что при диагностировании может быть произведен ряд действий.

Таким образом, например, если сделано заключение о наличии бактериальной инфекции, то субъект затем может быть подвергнут лечению антибиотиком.

Примеры антибиотиков включают, без ограничения, даптомицин; гемифлоксацин; телаванцин; цефтаролин; фидаксомицин; амоксициллин; ампициллин; бакампициллин; карбенициллин; клоксациллин; диклоксациллин; флуклоксациллину; мезлоциллин; нафциллин; оксациллин; пенициллин G; пенициллин V; пиперациллин; пивампициллин; пивмециллинам; тикарциллин; азтреонам; имипенем; дорипенем; меропенем; эртапенем; клиндамицин; линкомицин; пристинамицина; хинопристин; цефацетрил (цефацетрил); цефадроксил (цефадроксил); цефалексин (цефалексин); цефалоглицин (цефалоглицин); цефалониум (цефалониум); цефалоридин (цефалорадин); цефалотин (цефалотин); цефапирин (цефапирин); цефатризин; цефазафлур; цефазедон; цефазолин (цефазолин); цефрадин (цефрадин); цефроксадин; цефтезол; цефаклор; цефамандол; цевметазол; цефоницид; цефотетан; цефокситин; цефпрозил (цефпроксил); цефуроксим; цефузонам; цефкапен; фецдалоксим; цефдинир; цефдиторен; цефетамет; цефиксим; цефменоксим; цефодизим; цефотаксим; цефпимизол; цефподоксим; цефтерам; цефтибутен; цефтиофур; цефтиолен; цефтизоксим; цефтриаксон; цефоперазон; цефтазидим; цефклидин; цефепим; цефлупренам; цефоселис; цефозопран; цефпиром; цефхином, пятое поколение; цефтобипрол; цефтаролин, не классифицирован; цефакломезин; цефалорам; цефапарол; цефканел; цефедролор; цефемпидон; цефетризол; цефивитрил; цефматилен; цефмепидиниум; цефовицин; цефоксазол; цефротил; цефсумид; цефурацетим; цефтиоксид; азитромицин; эритромицин; кларитромицин; диритромицин; рокситромицин; телитромицин; амикацин; гентамицин; канамицина; неомицин; нетилмицин; паромомицин; стрептомицин; тобрамицина; флумекин; налидиксовую кислоту; оксолиновую кислоту; пиромидиновую кислоту; пипемидовую кислоту; розоксацин; ципрофлоксацин; эноксацин; ломефлоксацин; надифлоксацин; норфлоксацин; офлоксацин; пефлоксацин; руфлоксацин; балофлоксацин; гатифлоксацин; грепафлоксацин; левофлоксацин; моксифлоксацин; пазуфлоксацин; спарфлоксацин; темафлоксацин; тосуфлоксацин; бесифлоксацин; клинафлоксацин; гемифлоксацин; ситафлоксацин; тровафлоксацин; прулифлоксацин; сульфаметизол; сульфаметоксазолу; сульфисоксазол; триметоприм- сульфаметоксазол; демеклоциклин; доксициклин; миноциклин; окситетрациклин; тетрациклин; тигециклин; хлорамфеникол; метронидазол; тинидазол; нитрофурантоин; ванкомицин; тейкопланин; телаванцин; линезолид; циклосерин 2; рифампицин; рифабутин; рифапентин; бацитрацин; полимиксин В; биомицин; капреомицин.

Если сделано заключение о наличии вирусной инфекции, то субъект может быть подвергнут лечению противовирусным средством. Примеры противовирусных средств включают, без ограничения, абакавир; ацикловир; ацикловир; адефовир; амантадин; ампренавир; амплиген; арбидол; атазанавир; антрипла; балавир; боцепревирертет; цидофовир; комбивир; долутегравир; дарунавир; делавирдин; диданозин; докозанол; эдоксудин; эфавиренц; эмтрицитабин; энфувиртид; энтекавир; эколиевер; фамцикловир; фомивирсен; фосампренавир; фоскарнет; фосфонет; ингибитор слияния; ганцикловир; ибацитабин; имуновир; идоксуридин; имиквимод; индинавир; инозин; ингибитор интегразы; интерферон типа III; интерферон типа II; интерферон типа I; интерферон; ламивудин; лопинавир; ловирид; маравирок; мороксидин; метисазон; нельфинавир; невирапин; нексавир; оселтамивир; пегинтерферон альфа-2а; пенцикловир; перамивир; плеконарил; подофиллотоксин; ралтегравир; ингибитор обратной транскриптазы; рибавирин; ремантадин; ритонавир; пирамидин; саквинавир; софосбувир; ставудин; телапревир; тенофовир; тенофовир дизопроксил; типранавир; трифлуридин; тризивир; тромантадин; трувада; трапорвед; валацикловир; валганцикловир; викривирок; видарабин; вирамидин; зальцитабин; занамивир; зидовудин; противовирусные средства на основе РНК- интерференции; ингаляционные рибовирины; моноклональные антитела (торговое наименование Respigam); блокираторы нейраминидазы.

Информация, полученная с применением описанных здесь способов, может являться полезной в рамках дополнительных вариантов действий в отношении пациентов. Например, данная информация может применяться для определения, должен ли пациент быть госпитализирован. Она также может влиять на решение о пролонгации периода госпитализации. Она также может влиять на решение о том, следует ли проводить дополнительные тесты, или может предотвратить проведение необязательных тестов, таких как КТ и/или рентгенография и/или МРТ и/или культуральный и/или серологический и/или ПЦР-анализ на определенные бактерии и/или ПЦР анализ на вирусы и/или проведение процедур, таких как люмбальная пункция.

Часто является полезным с клинической точки зрения проанализировать у пациентов прогноз, тяжесть заболевания и конечный исход. Авторы настоящего изобретения определили, что низкие уровни TRAIL (ниже чем около 20 пг/мл или около 15 пг/мл или около 10 пг/мл или около 5 пг/мл или около 2 пг/мл) значительно коррелируют с плохим прогнозом и конечным исходом у пациента, а также с высокой тяжестью заболевания. Например, авторы настоящего изобретения показали, что взрослые пациенты в отделении интенсивной терапии (ICU), которые в целом являются тяжелобольными, имели значительно более низкие уровни TRAIL по сравнению со всеми другими пациентами, которые были менее больными, вне зависимости от инфекционной или неинфекционной этиологии заболевания.

Таким образом, в соответствии с другим аспектом настоящего изобретения предусмотрен способ прогнозирования течения заболевания, включающий измерение уровня белка TRAIL в сыворотке у субъекта с заболеванием, при этом если уровень TRAIL находится ниже предварительно определенного уровня, то прогноз является более негативным, чем у субъекта с заболеванием с уровнем белка TRAIL в сыворотке выше предварительно определенного уровня.

Способы измерения уровней белка TRAIL в сыворотке описаны выше.

Заболевание может представлять собой инфекционное или неинфекционное заболевание. Субъект может иметь заболевание, которое было диагностировано или не было диагностировано.

Конкретные примеры заболеваний включают, без ограничения, бактериальные инфекции (например, бактериемию, менингит, инфекции дыхательных путей, инфекции мочевыводящих путей и так далее), сепсис, физическую травму или травму, сердечно-сосудистые заболевания, заболевания, ассоциированные с множественным отказом органов, лекарственную нефротоксичность, острую почечную недостаточность, травму почек, расширенный цирроз и почечную недостаточность, острую или хроническую недостаточность левого предсердия, легочную гипертензию с/без недостаточности правого предсердия и различные типы злокачественных образований.

В соответствии с другим вариантом осуществления измеряют уровни дополнительных полипептидов, что помогает повышать точность прогнозирования. Таким образом, например, другие полипептиды, которые могут подвергаться измерению, включают IP-10, CRP, IL1RA, РСТ и SAA.

В соответствии с определенным вариантом осуществления измеряют уровни IP-10, CRP и TRAIL.

В соответствии с другим вариантом осуществления измеряют уровни только TRAIL.

Авторы настоящего изобретения обнаружили, что пациенты с очень низкими уровнями TRAIL (в соответствии с указанной выше классификацией) имеют более низкий шанс выздоровления и более высокий шанс возникновения осложнений. Соответственно, авторы настоящего изобретения предлагают, что при обнаружении у субъектов очень низких уровней TRAIL они должны подвергаться лечению средствами, которые применяются лишь в качестве последних оставшихся эффективными средств.

Такие средства, например, могут представлять собой, например, экспериментальные средства, которые не были полностью одобрены FDA. Другие последние оставшиеся эффективными средства представляют собой средства, в отношении которых известно наличие связи с тяжелыми побочными эффектами. Другой пример последнего оставшегося эффективным средства представляет собой антибиотик, такой как ванкомицин (который обычно не назначается с целью предотвращения резистентности к антибиотикам).

Очевидно, что также могут быть назначены средства, которые обычно не считаются последними оставшимися эффективными средствами, но в дозировках, которые превосходят клинически допустимые дозировки.

В соответствии с данным аспектом настоящего изобретения, если уровень TRAIL превышает предварительно определенный уровень, то пациент обычно не должен подвергаться лечению последним оставшимся эффективным средством.

Авторы настоящего изобретения обнаружили, что базальные уровни TRAIL у здоровых субъектов или пациентов с неинфекционным заболеванием являются более низкими у женщин по сравнению с мужчинами в рамках детородного возраста (Р-значение t-теста<0,001) (см. Фиг. 37А), однако не различаются в рамках пре- или пост-детородного возраста (P-значение t-теста=0,9, Фиг. 37А). Данный тренд не наблюдался у пациентов с инфекционным заболеванием.

Данная зависящая от возраста динамика может применяться для улучшения моделей, обеспечивающих различение субъектов с бактериальным, вирусным и неинфекционным заболеванием, или здоровых субъектов, как будет очевидно специалисту в данной области.

Например, модель может включать параметры, связанные с возрастом и полом. Если возраст субъекта находится в рамках определенного диапазона, свидетельствующего о фертильности (например, от 13 до 45 лет) и субъект является мужчиной, то могут применяться коэффициенты модели TRAIL для мужчин в детородном возрасте. Если возраст субъекта находится в рамках диапазона, свидетельствующего о фертильности, и субъект является женщиной, то могут применяться коэффициенты модели TRAIL для женщин в детородном возрасте. Если возраст субъекта находится вне диапазона, свидетельствующего о фертильности. то могут применяться коэффициенты модели TRAIL, которые не зависят от возраста.

Таким образом, в соответствии с другим аспектом изобретения предусмотрен способ определения типа инфекции у субъекта-женщины детородного возраста, при этом способ включает сравнение уровня белка TRAIL в сыворотке у субъекта с предварительно определенным пороговым значением, при этом указанное предварительно определенного пороговое значение соответствует уровню белка TRAIL в сыворотке здорового субъекта-женщины детородного возраста или группы здоровых субъектов-женщин детородного возраста, при этом разница между указанным уровнем белка TRAIL в сыворотке и указанным предварительно определенным пороговым значением свидетельствует о типе инфекции.

Таким образом, в соответствии с другим аспектом изобретения предусмотрен способ определения типа инфекции у субъекта-мужчины детородного возраста, при этом способ включает сравнение уровня белка TRAIL в сыворотке у субъекта с предварительно определенным пороговым значением, при этом указанное предварительно определенного пороговое значение соответствует уровню белка TRAIL в сыворотке здорового субъекта-мужчины детородного возраста или группы здоровых субъектов-мужчин детородного возраста, при этом разница между указанным уровнем белка TRAIL в сыворотке и указанным предварительно определенным пороговым значением свидетельствует о типе инфекции.

Очевидно, что предварительно определенные пороговые значения могут применяться для заключения о наличии или отсутствии определенного типа инфекции.

Таким образом, например, если уровень белка TRAIL в сыворотке превышает первое предварительно определенное пороговое значение, то тип инфекции является вирусным.

Если, например, уровень белка TRAIL в сыворотке превышает второе предварительно определенное пороговое значение, то тип инфекции не является бактериальным.

Если, например, уровень белка TRAIL в сыворотке является более низким, чем третье предварительно определенное пороговое значение, то тип инфекции является бактериальным.

Если, например, уровень белка TRAIL в сыворотке является более низким, чем четвертое предварительно определенное пороговое значение, то тип инфекции не является вирусным.

Как правило, указанные здесь здоровые субъекты-мужчины и субъекты- женщины не имеют известного заболевания. В соответствии с определенным вариантом осуществления контрольный субъект не имеет инфекционного заболевания.

Как правило, разница между уровнем белка TRAIL в сыворотке субъекта и предварительно определенным пороговым значением является статистически значимым различием, как описано выше.

В соответствии с используемым здесь значением, термин "около" означает ±10%.

Термины "включает", "включающий", "имеющий" и их варианты означают "включая, без ограничения".

Термин "состоящий из" означает "включающий и ограниченный".

Термин "состоящий по существу из" означает, что композиция, способ или структура может включать дополнительные элементы, этапы и/или части, но только если дополнительные элементы, этапы и/или части существенно не изменяют основные и связанные с новизной характеристики указанной композиции, способа или структуры.

В рамках данной заявки различные варианты осуществления данного изобретения могут быть представлены в формате диапазонов. Следует понимать, что описание в формате диапазона приведено для удобства и краткости и не должно рассматриваться в качестве негибкого ограничения области, охватываемой изобретением. Соответственно, описание диапазона должно рассматриваться в качестве явно описывающего все возможные поддиапазоны, а также отдельные числовые значения в рамках данного диапазона. Например, описание диапазона, такого как от 1 до 6, должно рассматриваться в качестве явно описывающего поддиапазоны, такие как от 1 до 3, от 1 до 4, от 1 до 5, от 2 до 4, от 2 до 6, от 3 до 6 и так далее, а также все отдельные числа в рамках такого диапазона, например 1, 2, 3, 4, 5 и 6. Это применимо вне зависимости от ширины диапазона.

В соответствии с используемым здесь значением, термин "способ" означает способы, средства, методы и процедуры для достижения указанной цели, включая, без ограничения, такие способы, средства, методы и процедуры, которые либо известны, либо могут быть легко разработаны на основе известных способов, средств, методов и процедур практикующими специалистами в области химии, фармакологии, биологии, биохимии и медицины.

В соответствии с используемым здесь значением, термин "лечение" включает устранение, существенное ингибирование, замедление или обращение прогрессирования состояния, существенное облегчение клинических или эстетических симптомов состояния или предотвращение появления клинических или эстетических симптомов состояния в значительной степени.

Следует понимать, что определенные признаки изобретения, которые для ясности описаны в контексте отдельных вариантов осуществления, также могут быть предусмотрены в виде комбинации в рамках единого варианта осуществления. Наоборот, различные признаки изобретения, которые для кратности описаны в контексте единого варианта осуществления, также могут быть предусмотрены по отдельности или в виде любой подходящей субкомбинации или в любом подходящем виде в рамках любого иного описанного варианта осуществления изобретения. Определенные признаки, описанные в контексте различных вариантов осуществления, не должны рассматриваться в качестве существенных признаков таких вариантов осуществления, если только подобный вариант осуществления не становится неработоспособным без таких элементов.

Различные варианты осуществления и аспекты настоящего изобретения, которые описаны выше и приведены ниже в Формуле изобретения, находят экспериментальное подтверждение в рамках нижеследующих примеров.

ПРИМЕРЫ

Далее будет приведена ссылка на нижеследующие примеры, которые наряду с приведенным выше описанием неограничивающим образом иллюстрируют некоторые варианты осуществления изобретения.

В целом, используемые здесь обозначения и лабораторные процедуры, применяемые в рамках настоящего изобретения, включают молекулярные, биохимические, микробиологические способы и способы на основе рекомбинантных ДНК. Подобные способы подробно описаны в литературе. См., например, "Molecular Cloning: A laboratory Manual" Sambrook et al., (1989); "Current Protocols in Molecular Biology" т. I-III Ausubel, R.M., ed. (1994); Ausubel et al., "Current Protocols in Molecular Biology", John Wiley and Sons, Baltimore, Maryland (1989); Perbal, "A Practical Guide to Molecular Cloning", John Wiley & Sons, New York (1988); Watson et al., "Recombinant DNA", Scientific American Books, New York; Birren et al. (eds) "Genome Analysis: A Laboratory Manual Series", т.1-4, Cold Spring Harbor Laboratory Press, New York (1998); методологии, описанные в патентах США 4666828; 4683202; 4801531; 5192659 и 5272057; "Cell Biology: A Laboratory Handbook", т. I-III Cellis, J.E., ed. (1994); "Culture of Animal Cells - A Manual of Basic Technique" Freshney, Wiley-Liss, N.Y. (1994), 3-е изд.; "Current Protocols in Immunology" т. I-III Coligan J.E., ed. (1994); Stites et al. (eds), "Basic and Clinical Immunology" (8-е изд.), Appleton & Lange, Norwalk, CT (1994); Mishell and Shiigi (eds), "Selected Methods in Cellular Immunology", W.H. Freeman and Co., New York (1980); доступные иммуноанализы подробно описаны в патентной и научной литературе, см., например, патенты США 3791932; 3839153; 3850752; 3850578; 3853987; 3867517; 3879262; 3901654; 3935074; 3984533; 3996345; 4034074; 4098876; 4879219; 5011771 и 5281521; "Oligonucleotide Synthesis" Gait, М.J., ed. (1984); "Nucleic Acid Hybridization" Hames, B.D., and Higgins S.J., eds. (1985); "Transcription and Translation" Hames, B.D., and Higgins S.J., eds. (1984); "Animal Cell Culture" Freshney, R.I., ed. (1986); "Immobilized Cells and Enzymes" IRL Press, (1986); "A Practical Guide to Molecular Cloning" Perbal, В., (1984) и "Methods in Enzymology" т. 1-317, Academic Press; "PCR Protocols: A Guide To Methods And Applications", Academic Press, San Diego, CA (1990); Marshak et al., "Strategies for Protein Purification and Characterization - A Laboratory Course Manual" CSHL Press (1996); все из которых полностью приведены здесь для ссылки. Другие общие ссылки приведены во всему объему данного описания. Считается, что указанные процедуры являются хорошо известными в данной области и приведены для удобства читателя. Вся содержащаяся информация приведена здесь для ссылки.

ПРИМЕР 1

Протеомная сигнатура организма для различения между бактериальной и вирусной инфекцией: Проспективное многоцентровое наблюдательное исследование

Способы

Исследуемая группа: В исследовании приняли участие всего 1002 пациента. Пациентов детского возраста (≤18 лет) набирали из педиатрических отделений неотложной помощи (PED), педиатрических палат и хирургических отделений, а взрослых пациентов (в возрасте >18 лет) - из отделений неотложной помощи (ED), отделений внутренней медицины и хирургических отделений. У каждого участника или законного представителя получали информированное согласие. Критерии включения в группу с инфекционным заболеванием включали: клиническое подозрение на наличие острого инфекционного заболевания, пиковую температуру >37,5°C с момент появления симптомов и продолжительность симптомов ≤12 дней. Критерии включения в контрольную группу включали: клинические признаки неинфекционного заболевания (например, травмы, инсульта или инфаркта миокарда) или здоровых субъектов. Критерии исключения включали: признаки какого-либо эпизода острого инфекционного заболевания в течение 2 недель перед включением в исследование, диагностированный врожденный иммунодефицит; текущее лечение на основе иммуносупрессорной или иммуномодулирующей терапии; активное злокачественное заболевание, подтвержденное или предполагаемое наличие заражения вирусом иммунодефицита человека (ВИЧ)-1, вирусом гепатита В (HBV) или вирусом гепатита С (НВС) (Фиг. 1А). Важно, что для обеспечения возможности широкого обобщения лечение антибиотиком при включении в исследование не являлось причиной исключения.

Процесс включения в исследования и сбор данных: Для каждого пациента записывали значения следующих базисных переменных: демографические показатели, показатели физического состояния, медицинскую историю (например, основные жалобы, сопутствующие диагнозы, постоянно применяемые лекарства, сопутствующие заболевания, время появления симптомов и пиковую температуру), результаты клинического анализа крови (СВС), полученные при включении в исследование и химические показатели (например, креатинин, мочевину, электролиты и печеночные ферменты). Назальный мазок получали от каждого пациента для дальнейшего микробиологического анализа, а для проведения скрининга на белок и проверки получали образец крови. Лечащие врачи в случае необходимости получали дополнительные образцы (например, образцы мочевины и стула в случаях подозрения на инфекцию мочевыводящих путей [UTI] и гастроэнтерита [GI], соответственно). Радиологические тесты проводили при назначении лечащим врачом (например, рентгенографию грудной клетки для субъектов с подозрением на наличие инфекции нижних дыхательных путей [LRTI]). Спустя тридцать дней после включения в исследование отмечали историю течения заболевания и реакцию на лечение. Всю информацию заносили в кастомизированную форму для электронной отчетности (eCRF).

Микробиологический анализ: Пациенты прошли два диагностических анализа на основе множественной ПЦР с применением назальных мазков: (i) Seeplex® RV15 (n=713) для детектирования вируса парагриппа 1, 2, 3 и 4, коронавируса 229E/NL63, аденовируса A/B/C/D/E, бокавируса 1/2/3/4, вируса гриппа А и В, метапневмовируса, коронавируса ОС43, риновируса А/В/С, респираторно-синцитиального вируса А и В и энтеровируса, и (ii) Seeplex® РВ6 (n=633) для детектирования Streptococcus pneumoniae, Haemophilus influenzae, Chlamydophila pneumoniae, Legionella pneumophila, Bordetella pertussis и Mycoplasma pneumoniae. Анализы на основе множественной ПЦР проводили в сертифицированной сервисной лаборатории. Пациенты также проходили тестирование на дополнительные патогены в соответствии с их предполагаемым клиническим симптомом, включая: культуры, выделенные из крови (n=420), мочи (n=188) и стула (n=66), на предмет Shigella spp., Campylobacter spp. и Salmonella spp.; серологическое тестирование (IgM и/или IgG) на цитомегаловирус (CMV), вирус Эпштейна-Барра (EBV), Mycoplasma Pneumonia и Coxiella burnetii (коксиеллез) (n=167, n=130, n=206 и n=41, соответственно).

Определение контрольного стандарта: Группа с точным диагнозом, Единогласная группа и Мажоритарная группа: Строгий композитный контрольный стандарт был разработан на основании рекомендаций, приведенных в Стандартах отчетности по диагностической точности (Standards for Reporting of Diagnostic Accuracy, STARD).38 Сначала для каждого пациента проводили микробиологический анализ, как описано выше. Затем все данные, собранные в рамках истории заболевания, анализировались комиссией из трех лечащих врачей. Для взрослых пациентов (возрастом >18 лет) комиссия включала лечащего врача и двух специалистов по инфекционным заболеваниям, в то время как для детей и подростков (возрастом ≤18 лет) она включает лечащего детского врача, эксперта по инфекционным заболеваниям и старшего лечащего педиатра. Каждый член комиссии присваивал одну из следующих диагностических категорий каждому пациенту: (i) бактериальное заболевание; (ii) вирусное заболевание; (iii) отсутствие явного инфекционного заболевания или здоровое состояние (контроли); и (iv) неопределенную категорию. Пациентов со смешанными инфекциями (бактериальными плюс вирусными) относили к категории пациентов с бактериальным заболеванием, поскольку они контролируются аналогичным образом (например, подвергаются лечению антибиотиками). Важно, что члены комиссии не были информированы о решениях своих коллег и общих результатах.

Данный процесс применяли для создания трех групп с повышенным уровнем диагностической точности (Фиг. 1А).

(i) Мажоритарная группа: Пациентов относили к данной группе на основании решения, по меньшей мере, двух из трех членов комиссии;

(ii) Единогласная группа (подгруппа Мажоритарной группы): Пациентов относили к данной группе на основании решения всех трех членов комиссии (термины "единогласная группа" и "консенсусная группа" используются здесь взаимозаменяемым образом); а

(iii) Группа с точным диагнозом (подгруппа Единогласной группы): Пациенты, отнесенные к группе с бактериальным заболеванием, получали единогласный диагноз всех трех членов комиссии, имели WBC >15000/мкл (пороговое значение, свидетельствующее о повышенном риске наличия бактериального заболевания11) и одно из следующих подтвержденных микробиологических заболеваний: бактериемию (с полученной из крови культурой с наличием роста), бактериальный менингит (с полученной из спинномозговой жидкости культурой с наличием роста), пиелонефрит (с полученной из мочи культурой с наличием роста и подтверждением поражения почек на основе УЗИ), инфекции мочевыводящих путей (с полученной из мочи культурой с наличием роста), септический шок (с полученной из крови культурой с наличием роста) или перитонзиллярный абсцесс (подтвержденных на основе хирургического исследования или компьютерной томографии). Пациенты, отнесенные к группе с наличием вирусного заболевания, получали единогласный диагноз от членов комиссии и имели положительные результаты тестирования на присутствие вируса.

Кроме того, отнесенные к контролям пациенты получали единогласный диагноз от всех трех членов комиссии.

Образцы, процедуры и измерения уровней белков. Образцы венозной крови хранили при 4°C в течение периода времени до 5 часов на месте проведения анализа и далее разделяли на плазму, сыворотку и общие лейкоциты и хранили при -80°C. Назальные мазки и образцы стула хранили при 4°C в течение периода времени до 72 часов и далее транспортировали в сертифицированную сервисную лабораторию для анализа на основе множественной ПЦР. В рамках фазы скрининга уровни белков организма измеряли в сыворотке и лейкоцитах с применением иммуносорбентного анализа с ферментной меткой (ELISA), технологии Luminex, белковых чипов и проточной цитометрии (на свежевыделенных лейкоцитах). После скрининга и разработки сигнатуры (см. раздел Протеомная сигнатура организма) были отобраны измерены три белка следующим образом: CRP измеряли с применением Cobas 6000, Cobas Integra 400, Cobas Integra 800 или Modular Analytics P800 (Roche). TRAIL и IP-10 измеряли с применением коммерческих наборов для ELISA (MeMed Diagnostics).

Статистический анализ: Первичный анализ был основан на площади под характеристической кривой (AUC), Чувствительности (ТР/Р), Специфичности (TN/N), Положительном критерии отношения правдоподобия (LR+ = Чувствительность/11-Специфичность]), Отрицательном критерии отношения правдоподобия (LR-=[1- Чувствительность] / Специфичность) и Соотношении диагностических коэффициентов (DOR=LR+/ LR-), где Р, N, TP и TN соответствуют положительным результатам (пациентам с бактериальным заболеванием), отрицательным результатам (пациентам с вирусным заболеванием), истинно положительным результатам (пациентам с правильно диагностированным бактериальным заболеванием) и истинно отрицательным результатам (пациентам с правильно диагностированным вирусным заболеванием), соответственно. Статистический анализ проводили с применением MATLAB. Вычисления размеров образцов представлены в Примере 2 ниже.

Скрининг протеома организма: Общий обзор процесса разработки, тренировки и тестирования мультивариативной логистической модели изображен на Фиг. 1В. Кратко, проводили системный описанный в литературе скрининг и биоинформатический анализ, позволивший идентифицировать 600 белков- кандидатов, которые с большой вероятностью дифференциально экспрессировались в образцах периферической крови пациентов с бактериальным заболеванием в отличие от пациентов с вирусным заболеванием, некоторые из которых играли известную роль в иммунной реакции организма на инфекцию, а другие не имели прямой связи с иммунной системой. Далее уровень каждого белка-кандидата измеряли у 20-30 пациентов из тренировочного набора (50% пациентов с вирусным заболеванием и 50% пациентов с бактериальным заболеванием) и применяли P-значение <0,01 в рамках критерия Уилкоксона (WS) для скрининга белков со статистически значимыми дифференциальными измерениями. Это привело к получению набор из 86 белков (значение ожидаемой доли ложных отклонений [FDR] 0,07). Уровень каждого из данных белков затем анализировали у 100 дополнительных пациентов (50% пациентов с вирусным заболеванием и 50% пациентов с бактериальным заболеванием) и также подвергали скринингу с пороговым значением отсечения в рамках t-критерия P<10-4, что позволило определить 14 белков, которые значительно различались в плане экспрессии у пациентов с вирусным заболеванием по сравнению с пациентами с бактериальным заболеванием (FDR<0,001).

Разработка и проверка сигнатуры: Применяли процесс отбора признаков для идентификации оптимальной комбинации белков. Применяли две схемы отбора признаков: схему на основе минимума-максимума взаимной информации39 и жадной обертки40, в рамках которых применяется серия итераций для добавления или удаления признаков. Процесс останавливали, когда повышение эффективности при использовании тренировочного набора более не являлось статистически значимым (P>0,05). Оба процесса конвергировались до одного конечного набора из трех белков. Для интеграции уровней белков в один балл было проанализировано множество вычислительных моделей. Их эффективность существенно не различалась (Р>0,1, как далее описано в Примере 2 ниже). Была выбрана модель на основе полиномиальной логистической регрессии (MLR), поскольку она обеспечивает возможность вероятностной интерпретации путем присвоения диагнозу пациента балла вероятности. Сигнатура использует данное свойство для исключения пациентов, чья вероятность наличия бактериальной инфекции является промежуточной: между 0,35 и 0,55. Для описания данных пациентов здесь используется термин "промежуточная иммунная реакция", поскольку их профиль располагается между реакциями организма на бактериальную инфекцию и вирусную инфекцию. Пациенты из Мажоритарной когорты были разделены на тренировочные и тестируемые набор, каждый из которых включал 50% пациентов (Фиг. 1В). Тренировочный набор включал 120 пациентов, которые принимали участие в процессе скрининга, и дополнительных пациентов, которые были включены произвольным образом. Тестируемый набор включает остальных пациентов и применялся для независимого анализа эффективности сигнатуры. Важно, что ни один из пациентов из тестируемого набора не применялся для тренировки алгоритмов или для отбора белков. Перекрестную проверку с исключением 10% применяли для оценки эффективности модели. Более подробная информация о структуре модели приведена в Примере 2 ниже.

РЕЗУЛЬТАТЫ

Характеристики пациентов: Три лечащих врача независимо относили каждого пациента к определенной категории (имеющих бактериальное заболевание, вирусное заболевание, контролям, или к неопределенной категории). Категории применяли для создания трех групп с повышенным уровнем диагностической точности: Мажоритарной группы (n=765), Единогласной группы (n=639) и Группы с точным диагнозом (n=312) (Фиг. 1А). Кроме того, 98 пациентов относили к неопределенной категории, поскольку лечащие врачи не могли определить этиологию заболевания или отнести их к Мажоритарной группе. Подробная характеристика Мажоритарной группы приведена в Таблице 1. Кратко, группу балансировали на основе возраста (47% женщин, 53% мужчин) и включали 56% пациентов детского возраста (≤18 лет) и 44% взрослых (возрастом >18 лет). У пациентов наблюдался широкий ряд клинических симптомов (например, RTI, UTI и системные инфекции), значений максимальной температуры (36-41,5°С), значений продолжительности периодов времени с начала появления симптомов (0-12 дней), сопутствующих заболеваний и принимаемых лекарственных средств (Таблица 1 и Фиг. 6А-12В). Всего были определены 56 видов патогенов, которые отвечают за большинство случаев острых инфекционных заболеваний в Западном мире (Фиг. 7А-В).

Таблица 1 - Базисные характеристики пациентов из Мажоритарной группы. Значения представляют собой числа (доли). Представлены только микроорганизмы, детектированные более чем у 5 пациентов. CNS - центральная нервная система, GI - гастроэнтерит, LRTI - инфекция нижних дыхательных путей, UTRI - инфекция верхних дыхательных путей, UTI - инфекция мочевыводящих путей, N/A - здоровые контроли или пациенты, для которых не были получены данные. Подгруппа вируса гриппа А включала штаммы H1N1. Подгруппа атипичных бактерий включала Chlamydophila pneumoniae, Mycoplasma pneumonia и Legionella pneumophila. Подгруппа кишечных вирусов включала ротавирус, астровирус, кишечный аденовирус и норовирус G I/II. При анализе клинического синдрома LRTI группа включала пневмонию, бронхиолит, острый бронхиолит и ларингит; группа URTI включала фарингит, острый средний отит, острый синусит и острый тонзиллит.

Эффективность сигнатуры у Группы с точным диагнозом, Единогласной группы и Мажоритарной группы: Из 600 подвергнутых скринингу белков организма и их комбинаций наилучшая сигнатура для различения пациентов с бактериальным заболеванием, вирусным заболеванием и контрольных пациентов в тренировочном наборе Мажоритарной группы включала три растворимых белка: TNF-родственный индуцирующий апоптоз лиганд (TRAIL), интерферон-гамма-индуцируемый белок 10 (IP-10) и С-реактивный белок (CRP) (Фиг. 2А-С). AUC сигнатуры для различения бактериальных и вирусных инфекций в рамках тестируемого набора Мажоритарной группы составлял 0,94±0,04. Аналогичные результаты были получены с применением перекрестной проверки с исключением 10% всей Мажоритарной группы (AUC=0,94±0,02). Сигнатура значительно превосходила все отдельные белки, проанализированные на этапе скрининга (Р<10-6). Процедуры тренировки и тестирования повторяли в отношении Единогласной группы и Группы с точным диагнозом с получением AUC в размере 0,96±0,02 и 0,99±0,01, соответственно. Поэтапное повышение эффективности соответствует повышенной достоверности контрольного стандарта в рамках трех групп (Таблица 2, ниже).

А. Значения эффективности и их 95% доверительные интервалы получали с применением перекрестной проверки с исключением 10% у всех пациентов из Группы с точным диагнозом (nБакт.=27, nВирусн.=173), единогласной группы (nБакт.=256, nВирусн.=271) и Мажоритарной группы (nБакт.=319, nВирусн.=334). В. Анализ повторяли после исключения пациентов с промежуточной иммунной реакцией (Группа с точным диагнозом [nБакт.=27, nВирусн.=159, nПромеж.=14], Единогласная группа [nБакт.=233, nВирусн.=232, nПромеж.=62] и Мажоритарная группа [nБакт.=290, nВирусн.=277, nПромеж.=88]), что соответствует вероятному способу применения сигнатуры лечащими врачами.

Далее, авторы настоящего изобретения применяли сигнатуру для различения пациентов с инфекционным (бактериальным или вирусным) заболеванием и неинфекционных контролей в рамках тестируемого набора Мажоритарной группы, что приводило к получению AUC в размере 0,96±0,02. Дальнейшая оценка с применением перекрестной проверки с исключением 10% давала аналогичные результаты (AUC=0,96±0,01). Сигнатура превосходила любой из отдельных белков (Р<10-8). Оценка на Единогласной группе и Группе с точным диагнозом опять же показывала повышенные значения AUC в размере 0.97±0,02 и 0,97±0,03, соответственно. Для получения консервативных оценок эффективности сигнатуры описанный ниже анализ был выполнен в отношении Мажоритарной группы.

Сравнение с лабораторными показателями, клиническими параметрами и хорошо известными биомаркерами: Сигнатуру сравнивали с хорошо известными клиническими параметрами и лабораторными показателями, включая количество белых кровяных клеток (WBC), абсолютное количество нейтрофилов (ANC), долю нейтрофилов, максимальную температуру, пульс и интенсивность дыхания (Фиг. 3А и Пример 2). Сигнатура превосходила все отдельные параметры (Р<10-18). Далее сигнатуру сравнивали с комбинацией нескольких клинических параметров. С этой целью получали полиномиальные логистические модели для всех комбинаций вплоть до четырех клинических параметров. Наиболее эффективная пара, триплет и квадруплет, изображены на Фиг. 3А (добавление пятого параметра не повышало эффективность). Сигнатура являлась значительно более эффективной, чем наиболее эффективная комбинация клинических параметров (Р<10-15), которая состояла из ABC, пульса, % лимфоцитов и % моноцитов (AUC=0,94±0,02 против 0,77±0,04). Далее эффективность сигнатуры сравнивали с РСТ и CRP, двумя белками, которые обычно применяются в клинической практике для диагностики сепсиса и бактериальных инфекций (Пример 2). Сигнатура была значительно более эффективной, чем оба белка (Р<10-8 и Р<10-6, соответственно). Сигнатура также была более эффективной, чем широкий диапазон белков организма с известной ролью в плане иммунной реакции на инфекцию, включая сепсис, и связанных с бактериями (например, TREM, IL-6 и IL-8), связанных с вирусами (например, IFN-γ и IL-2), и связанных с воспалением (например, IL-1a и TNF-α) белков (Р<10-8) (Фиг. 3В и Пример 2 ниже).

Эффективность сигнатуры является устойчивой в рамках различных подгрупп пациентов: Гетерогенность пациентов и патогенов, которая является неотъемлемой частью реальных клинических условий, может отрицательно влиять на диагностическую применимость любого отдельного биомаркера организма. Для анализа способности сигнатуры, представляющей собой комбинацию множества биомаркеров, поддерживать стабильную эффективность несмотря на различные условия у различных пациентов были проведены анализы с использованием подгрупп. Сигнатура являлась устойчивой (AUC от 0,87 до 1,0) в рамках широкого диапазона характеристик пациентов, включая возраст, клинический синдром, время с момента проявления симптомов, максимальную температуру, вид патогенов, сопутствующие заболевания, лечение лекарственными средствами для хронических заболеваний, и место применения (Фиг. 4 и Пример 2, ниже). Сигнатуру также тестировали на подгруппе пациентов, которых технически были исключены, но имели были отнесены к Единогласной группе комиссией экспертов, что соответствовало значению AUC 0,96±0,06 (nБакт.=27, nВирусн.=14). Это может свидетельствовать о том, что сигнатура может применяться более широко в рамках условий, который были первоначально исключены (например, у пациентов с субфебрильной температурой).

Эффективность сигнатуры остается неизменной при наличии потенциальных бактерий-колонизаторов: Многие вызывающие заболевания бактерии также представляют собой часть естественной флоры и часто обнаруживаются у субъектов без симптомов12,42-44. Подобные бактерии вызывают значительные трудности при диагностике, поскольку их обнаружение необязательно связано с их ролью в плане возникновения заболевания; таким образом, подходящее лечение может оставаться неясным. Авторы настоящего изобретения попытались определить влияние их наличия на эффективность сигнатуры.

Streptococcus pneumoniae (SP) и Haemophilus influenzae (HI), детектируемые с помощью ПЦР в назальных мазках, представляли собой две наиболее часто встречающиеся бактерии в рамках Мажоритарной группы (Таблица 1, выше). Высокие количества SP и HI были обнаружены как у пациентов с бактериальным заболеванием, так и у пациентов с вирусным заболеванием (SP: 36% и 47%; HI: 20% и 32%), являясь основанием для понимания того, что само их наличие необязательно вызывает заболевание.12 Пациенты были подвергнуты стратификации на основании того, имели ли они SP (SP+: nБакт.=116, nВирусн.=157; SP-: nБакт.=203, nВирусн.=177), при этом сравнивали эффективность AUC обеих групп. Значительное различие не наблюдалось (0,93±0,03 против 0,94±0,02, Р=0,31). Наличие или отсутствие HI также не влияло на эффективность сигнатуры (0,94±0,04 против 0,93±0,02; HI+: nБакт.=63, nВирусн.=106; HI-: nВакт.=256, nВирусн.=228, Р=0,34). Это свидетельствует о том, что наличие SP и HI не влияет на эффективность сигнатуры.

Обсуждение

Была разработана стратегия на основе строгого композитного контрольного стандарта, которая включала сбор клинических данных, группу химических анализов и широкий ряд микробиологических тестов с последующим отнесением к определенной группе тремя независимыми лечащими врачами. Данный процесс позволял получать иерархию из трех подгрупп с уменьшающимся размером и повышающейся достоверностью контрольного стандарта: Мажоритарной подгруппы, Единогласной подгруппы и Подгруппы с точным диагнозом. Соответствующие AUC сигнатуры составляли 0,94±0,02, 0,96±0,02 и 0,99±0,01. Данное поэтапное повышение эффективность может быть отнесено к повышению достоверности контрольного стандарта. Однако повышенная точность, в частности в рамках Группы с точным диагнозом, также может быть частично вызвана смещением отбора пациентов с тяжелым заболеванием или очевидным диагнозом. Таким образом, представленный здесь первичный анализ был сосредоточен на Мажоритарной группе, которая включает более широкий спектр степени тяжести заболевания и сложные в плане диагностики случаи. Данная группа потенциально включает некоторые ошибочные решения о включении в данную группу, что приводит к консервативным оценкам точности сигнатуры.

Сигнатура отвечает на несколько вызовов, присущих современным микробиологическим тестам, (i) Сложность диагностики инфекции в недоступных или неизвестных участках. Сигнатура обеспечивает точную диагностику подобных случаев, включая инфекции нижних дыхательных путей (AUC 0,95±0,03, n=153) и высокую температуру без явного источника (AUC=0,97±0,03, n=123). (ii) Продолжительное время, необходимое для получения результатов (от часов до дней). В рамках сигнатуры осуществляется измерение уровней растворимых белков, которые легко поддаются проведению быстрого измерения (в течение нескольких минут) при использовании больничных автоматизированных устройств для проведения иммуноанализа и стационарных устройств, (iii) Смешанные инфекции могут приводить к неточной диагностике, поскольку детектирование вируса не исключает наличия сопутствующей бактериальной инфекции.14,15 Сигнатура решает эту проблему благодаря отнесению смешанных инфекций к одной категории наряду с исключительно бактериальными инфекциями, что позволяет лечащим врачам работать с обеими группами аналогичным образом в плане лечения антибиотиками. Тот факт, что смешанные сопутствующие инфекции вызывали протеомную реакцию организма, которая является аналогичной реакции на исключительно бактериальную инфекцию, но не смесь различных реакций, может свидетельствовать о доминировании бактериальных инфекций над вирусными в плане биологического маршрута, (iv) Значительный недостаток микробиологических тестов, в частности ПЦР, заключается в детектировании потенциальных бактерий-колонизаторов у субъектов с небактериальными заболеваниями.12,13 Эффективность сигнатуры не изменялась в зависимости от наличия или отсутствия потенциальных бактерий-колонизаторов.

Белки организма, такие как РСТ, CRP и IL-6, традиционно применяют для содействия при диагностировании бактериальных инфекций, поскольку они предоставляют дополнительную информацию по клиническим симптомам, количеству в крови и микробиологическим показателям.11 Тем не менее, вариабельность в рамках одного пациента и в плане различных патогенов ограничивает их применимость.21-27 Комбинации белков организма обладают потенциалом в плане преодоления данного ограничения, однако на сегодняшний день по сравнению с отдельными белками они обеспечили улучшение диагностики в степени от незначительного до умеренного.11,35-37 Данное умеренное улучшение может обеспечиваться комбинацией индуцируемых бактериями белков, которые являются чувствительными по отношению к тем же факторам и, таким образом, являются менее способными компенсировать эффект друг друга. Соответственно, крупное улучшение наблюдалось при применении комбинаций, которые включали уровни белков в организме, клинические параметры и другие тесты.11,35-37 Однако получение данных множественных параметров в реальном времени зачастую неосуществимо.

Для решения данной проблемы была идентифицирована комбинация белков с комплементарным действием. В частности, было обнаружено, что TRAIL индуцировался в ответ на вирусы и подавлялся бактериями, IP-10 имел более высокий уровень при вирусных инфекциях по сравнению с бактериальными инфекциями, а уровень CRP был выше при бактериальных инфекциях по сравнению с вирусными инфекциями. В то время как применение повышенного уровня CRP в качестве индикатора наличия бактериальных инфекций является хорошо известным31,45, включение новых индуцируемых вирусами белков для дополнения традиционно применяемых индуцируемых бактериями белков по существу обеспечивало стабильность сигнатуры в рамках широкого диапазона подгрупп, включая, помимо прочего, время с момента появления симптомов, вид патогенов и сопутствующие заболевания. Например, аденовирусы, представляющие собой важную подгруппу вирусов, которые вызывают 5%-15% острых инфекций у детей, являются особенно сложными в плане диагностики, поскольку они вызывают клинические симптомы, которые имитируют бактериальную инфекцию.46 Стандартные лабораторные параметры обеспечивают плохую эффективность в рамках данной подгруппы по сравнению с сигнатурой (AUCs=0,60±0,10 [WBC], 0,58±0,10 [ANC], 0,88±0,05 [сигнатура]; n=223).

Несмотря на прогресс в области диагностики инфекционных заболеваний, своевременная идентификация бактериальных инфекций остается затрудненной, что приводит к излишнему применению антибиотиков и сопутствующим широкомасштабным последствиям в плане здравоохранения и экономики. Для удовлетворения потребности в улучшенном виде лечения авторы настоящего изобретения разработали и проверили сигнатуру, в рамках которой скомбинированы новые и традиционные белки организма для различения бактериальных и вирусных инфекций. Настоящее открытие, сделанное в рамках крупного объема выборки пациентов, являются многообещающим, что свидетельствует о том, что данная сигнатура обладает потенциалом в плане помощи лечащим врачам при лечении пациентов с острым инфекционным заболеванием и снижения частоты излишнего применения антибиотиков.

ПРИМЕР 2

Протеомная сигнатура организма для различения бактериальной и вирусной инфекции: Проспективное многоцентровое наблюдательное исследование - дополнительный материал

Меры точности: Сигнатура включает уровни трех белковых биомаркеров, измеренные у субъекта, и включает вычисление числового балла, который отражает вероятность наличия бактериальной инфекции по сравнению с вирусной инфекцией. Для количественного анализа диагностической точности сигнатуры применяли пороговое значение балла и проводили следующие измерения: чувствительность, специфичность, положительная прогностическая ценность (PPV), отрицательная прогностическая ценность (NPV), общая точность, положительный критерий отношения правдоподобия (LR+), отрицательный критерий отношения правдоподобия (LR-) и соотношение диагностических коэффициентов (DOR). Данные измерения осуществляются следующим образом:

Р, N, TP, FP, TN, FN представляют собой положительные результаты, отрицательные результаты, истинно положительные результаты, ложноположительные результаты, истинно отрицательные результаты и ложноотрицательные результаты, соответственно. Распространенность представляет собой относительную частотность положительного класса (то есть распространенность = Р/(Р+N)). Если не указано иное, положительные результаты и отрицательные результаты соответствуют пациентам с бактериальными и вирусными инфекциями, соответственно.

Площадь под характеристической кривой (AUC) также применяли для осуществления не зависящих от порогового значения сравнений различных диагностических способов. Подробное описание формулирования и вычисления доверительного интервала (CI) AUC см. в Hanley and McNeil.1 В рамках данного описания указаны 95% CI измерений точности.

Объем выборки: Первичная задача исследования заключалась в определении эффективности сигнатуры в плане классификации пациентов с заболеванием вирусной и бактериальной этиологии. Было определено, что объем выборки, требуемый для того, чтобы отвергнуть нулевую гипотезу о том, что чувствительность и специфичность в рамках всей группы, то есть Р, являются ниже Р0=75% при уровне значимости 1%, составлял 90% для 15% разности (Р1-Р0≥15%), то есть 394 пациентов (197 пациентов с вирусным заболеванием и 197 пациентов с бактериальным заболеванием). Кроме того, было предварительно определено, что примерно 15% пациентов будут иметь неопределяемый источник инфекции, при этом 10% будут исключены по техническим причинам и 10% будут являться здоровыми или неинфекционными контролями. Исследование требовало включения всего, по меньшей мере, 607 пациентов. Данное требование было выполнено, поскольку в исследовании приняли участие 1002 пациента.

Построение вычислительной модели логистической модели: Для включения уровней белков в одиночный прогностический балл было проанализировано множество вычислительных моделей, включая Искусственные нейронные сети (ANN), Методы опорных векторов (SVM), Байесовские сети (BN), Анализ на основе k-ближайших соседей (KNN) и Полиномиальную логистическую регрессию (MLR).2-3 Значения AUC для различения между бактериальной и вирусной инфекцией, полученные в рамках Мажоритарной группы с применением перекрестной проверки с исключением 10%, составляли 0,93±0,02 (ANN), 0,93±0,02 (SVM [линейный]), 0,94±0,02 [SVM (радиальная базисная функция)], 0,92±0,02 (BN), 0,91±0,02 (KNN) и 0,94±0,02 (MLR). Значительная разница в эффективности ANN, SVM и MLR моделей (Р>0,1 при сравнении их AUC) не наблюдалась. Авторы настоящего изобретения выбрали MLR, поскольку она обеспечивает возможность вероятностной интерпретации путем присвоения диагнозу пациента балла вероятности.

Авторы настоящего изобретения выполнили тренировку и тестирование MLR сигнатуры для различения заболеваний бактериальной и небактериальной этиологии. Поскольку распространенность лежащих в основе этиологии варьируется в рамках различных клинических условий, более ранние полученные с помощью моделей результаты корректировали для соответствия равной базисной распространенности (50% - бактериальные заболевания и 50% - небактериальные заболевания). В рамках группы без бактериального заболевания более ранние результаты были скорректированы до 45% вирусных заболеваний и 5% неинфекционных заболеваний для соответствия предполагаемому более высокой распространенности пациентов с вирусными заболеваниями против пациентов с неинфекционными заболеваниями среди субъектов с подозрением на наличие острой инфекции. Весовые коэффициенты MLR и их соответствующие 95% доверительные интервалы, а также p-значения, связанные с каждым коэффициентом, приведены в Таблицах 3-4 ниже. При сравнительном анализе бактериальных инфекций и вирусных инфекций вероятности корректировали для соответствия общей суммы 1 (Pb_скоррект.=[Pb+Pv] и Pb_скоррект.=[Pb+Pv], где Pb и Pv соответствуют вероятности бактериальных и вирусных инфекций, соответственно).

Логистические калибровочные кривые: В целях анализа проверки MLR модели вычисленные прогностические значения вероятности сравнивали с реально наблюдаемыми конечными результатами (Фиг. 5). Прогностические вероятности близко соответствовали наблюдаемым, что обеспечивало 5 дополнительную демонстрацию правильности модели.

Общие данные по группам пациентов, применяемым в данном исследовании: Всего было набрано 1002 пациентов и 892 пациентов приняли участие в исследовании (110 были исключены на основании предварительно определенных критериев исключения). На основе описанного в разделе "Способы" Примера 1 процесса определения контрольного стандарта пациентов относили к четырем различным диагностическим группам: (i) бактериальное заболевание; (ii) вирусное заболевание; (iii) отсутствие явного инфекционного заболевания или здоровое состояние (контроли); и (iv) неопределенная категория. Пациентов со смешанными инфекциями (бактериальными плюс вирусными) относили к категории пациентов с бактериальным заболеванием, поскольку они контролируются аналогичным образом (например, подвергаются лечению антибиотиками) (Фиг. 1А). Всего у 89% всех принимавших участие в исследовании пациентов был поставлен диагноз, при этом эта доля соответствует приводимому в литературе пределу.4-6 В дальнейших разделах приведено подробное описание характеристик пациентов, которое включает всех пациентов с конечным диагнозом (n=794): 765 пациентов из Мажоритарной группы и 29 пациентов, для которых образцы сыворотки были подвергнуты обеднению на этапе скрининга (Фиг. 1А-В).

Распределение по возрасту и полу: В исследовании принимали участие пациенты всех возрастов. Пациенты с не вызывающим сомнение диагнозом (пациенты с диагнозом; n=794) включали больше пациентов детского возраста (≤18 лет), чем взрослых (>18 лет) (445 пациентов [56%] против 349 [44%]). Распределение по возрасту было относительно равномерным для пациентов в возрасте 20-80 лет и достигала пика при значении возраста <4 лет для пациентов детского возраста (Фиг. 6А-В). Наблюдаемое распределение по возрасту для пациентов детского возраста соответствует ожидаемому и отражает фоновое распределение в рамках условий стационара7 (например, отделения неотложной помощи [ED], педиатрических отделений и отделений внутренней медицины). В исследовании принимали участие пациенты обоих полов. Группа пациентов являлась сбалансированной в плане распределения по полу (47% женщин, 53% мужчин).

Детектированные патогены: Применяли широкий набор микробиологических инструментов для максимизации степени детектирования патогенов. По меньшей мере, один патоген детектировали у 65% пациентов с острым инфекционным заболеванием (56% всех 794 пациентов с поставленным диагнозом). Всего 36 различных патогенов были детектированы активным образом с применением множественной ПЦР, детектирования антигенов и серологического исследования. Дополнительные 20 патогенов детектировали с применением стандартных культуральных способов или самостоятельно проводимой ПЦР. Были детектированы всего 56 различных патогенов, принадлежащих ко всем основным подгруппам патогенов (Фиг. 7А). Данная степень идентификации патогенов аналогична степени, которая отмечена в раннее опубликованных исследованиях, и включает патогены из всех основных подгрупп патогенов (грамотрицательные бактерии, грамположительные бактерии, атипичные бактерии, РНК вирусы и ДНК вирусы). У 13% пациентов были детектированы патогены из более чем одной указанной выше подгруппы патогенов (Фиг. 7А).

Патогенные штаммы, обнаруженные в рамках данного исследования являются ответственными за широк ряд острых инфекционных заболеваний в Западном мире и включают ключевые патогены, такие как вирус гриппа А/В, респираторно-синцитиальный вирус (RSV), парагрипп, Е. Coli, Streptococcus группы А и так далее. Следует отметить, что анализ детектированных патогенов выявил, что ни один из данных патогенов не является доминирующим (Фиг. 7В).

Вовлеченные физиологические системы и клинические синдромы: У пациентов с инфекционным заболеванием (все пациенты с диагнозом [n=794], за исключением пациентов с неинфекционными заболеваниями или здоровых субъектов, n=673) присутствовали инфекции в различных физиологических системах (Фиг. 8). Наиболее частой вовлеченной системой являлась респираторная система (46%) и затем системные инфекции (22%). Все инфекции, которые не поражали вышеуказанные системы и не являлись поражающими желудочно- кишечный тракт, мочевыводящую систему, сердечно-сосудистую систему или центральную нервную систему (CNS), относили к категории "Другие" (например, панникулит, абсцесс). Наблюдаемое распределение пораженных физиологических систем отражает естественное распределение и соответствует распределению в крупных группах пациентов, включенных в выборку в течение года.

У пациентов с диагнозом в рамках настоящего исследования (n=794) присутствовал ряд клинических синдромов (Фиг. 9А-В), который отражал ожидаемую клиническую гетерогенность в рамках группы пациентов детского и взрослого возраста, собранной в течение года. Наиболее частым клиническим синдромом являлся LRTI (21%), включая в основном пневмонию, бронхит, бронхиолит, обострение хронической обструктивной болезни легких (COPD) и неспецифическую LRTI. Вторым наиболее частым синдромом являлась системная инфекция (19%), включая в основном случаи высокой температуры без явного источника и скрытой бактериемии. Системные инфекции в основном детектировались у детей в возрасте <3 лет, но также детектировались и у нескольких взрослых пациентов. Системные инфекции представляют собой серьезную клиническую проблему, поскольку соблюдение баланса между риском для пациента и стоимостью тестирования/лечения является сложным. Третьим наиболее частым клиническим синдромом являлась URTI (19%), включая в основном острый тонзиллит, острый фарингит, неспецифическую URTI, острый синусит и острый средний отит. Следующими наиболее частыми синдромами являлись гастроэнтерит (12%), UTI (7%) и панникулит (4%). CNS инфекции (2%) включали септический и асептический менингит. Дополнительные клинические синдромы (1%) относили к категории "Другие", при этом они включали менее распространенные инфекции (например, наружный отит, эпидидимит и так далее).

Наблюдаемый паттерн распределения клинических синдромом соответствует наиболее частым и клинически релевантным симптомам и согласуется с ранее опубликованным крупным исследованиям.

Температура тела: Температура тела представляет собой важный параметр при оценке степени тяжести инфекционного заболевания. Распределение максимальных значений температуры тела анализировали у всех пациентов с диагнозом (n=794) на основе наиболее высокого значения температуры тела (при пероральном или ректальном измерении). Распределение максимальных значений температуры тела было относительно равномерным между 38°C и 40°C с пиковым значением 39°C (Фиг. 10). Температура тела <37,5°С была определена у 15% пациентов (подгруппа пациентов с неинфекционными заболеваниями или здоровыми субъектами). Температура тела ≥40,5°C являлась редкой (<3% пациентов). Общие результаты наблюдаемого распределения соответствуют нормальному диапазону температур в клинических условиях.

Время с момента появления симптомов: "Время с момента появления симптомов" было определено как продолжительности (в днях) с момента появления первого видимого симптома (первый видимый симптом мог представлять собой высокую температуру, но также мог представлять собой другой симптом, такой как тошнота или головная боль перед появлением высокой температуры). Распределение "времени с момента появления симптомов" в нашей группе (все пациенты с диагнозом, n=794) достигало пика спустя 2-4 дня после появления симптомов (35% пациентов) со значительными долями пациентов, обратившихся за медицинской помощью либо быстрее, либо позднее (Фиг. 11).

Сопутствующие заболевания и постоянный прием лекарственных средств: Сопутствующие заболевания и постоянный прием лекарственных средств теоретически могут влиять на результаты диагностического теста. Из всех пациентов с диагнозом 62% не имели сопутствующих заболеваний, в то время как 38% имели ≥1 хроническое заболевание. Кроме того, 75% пациентов не подвергались лечению постоянно принимаемыми лекарственными средствами, а 25% подвергались лечению ≥1 постоянно принимаемым лекарственным средством. Наиболее частыми хроническими заболеваниями в рамках нашей группы пациентов являлись гипертензия, гиперлипидемия, заболевания легких (например, COPD, астма и так далее), сахарный диабет (в основном 2 типа) и ишемические заболевания сердца, что соответствует наиболее частым хроническим заболеваниям в Западном мире (Фиг. 12А). Распределение постоянно принимаемых лекарственных средств, применяемых нашей группой пациентов, сильно коррелировало с диапазоном присутствующих хронических заболеваний (например, 29% пациентов с сопутствующими заболеваниями имели гиперлипидемию, при этом понижающие уровень липидов средства являлись наиболее часто применяемыми лекарственными средствами). Другие часто применяемые лекарственные средства включали аспирин, лекарственные средства для контроля уровня глюкозы в крови и бета-блокаторы (Фиг. 12В).

Места набора пациентов: Пациентов детского возраста (≤18 лет) набирали из педиатрических отделений неотложной помощи (PED), педиатрических больничных палат и хирургических отделений, а взрослых (>18 лет) - из отделений неотложной помощи (ED), отделений внутренней медицины и хирургических отделений. Педиатрические ED являлись наиболее частым местом набора (39%), а другие места набора имели сравнимые значения (17-20%), что соответствует относительно сбалансированному процессу набора. Соотношение между пациентами из ED и госпитализированными пациентами составляло ~1:1 для взрослых и ~2:1 для детей (Фиг. 13).

Характеристики исключенных пациентов: Из 1002 пациентов, которые были набраны для данного исследования, были исключены 110 пациентов (11%) (некоторые пациенты соответствовали более чем одному критерию исключения). Наиболее частой причиной исключения являлась повышенная температура, которая была ниже порогового значения 37.5°C в рамках исследования (n=54), и далее время с момента появления симптомов >12 дней (n=26) и недавно перенесенное (за последние 14 дней) инфекционное заболевание (n=22). Другие причины исключения включали активное злокачественное заболевание (n=14) и ослабленный иммунитет (например, вследствие лечения иммуносупрессорным лекарственным средством; n=2).

Характеристики пациентов с неопределенным заболеванием: Всего 98 пациентов были определены как имеющие неопределенное заболевание на основе неспособности экспертной комиссии надежно определить композитный контрольный стандарт, несмотря на строгий набор лабораторной и клинической информации. Несмотря на невозможность прямого анализа эффективности сигнатуры у данных пациентов при отсутствии контрольного стандарта, является возможным проанализировать их реакцию на основе белков организма в целях оценки их отличия от пациентов с контрольным стандартом. Авторы сравнили распределение TRAIL, IP-10 и CRP у пациентов с острой инфекцией с контрольным стандартом (n=653) с пациентами без контрольного стандарта (n=98). Отмечали количество статистических значимых различий (P-значение критерия Колмогорова-Смирнова = 0,20, 0,25, 0,46 для TRAIL, IP-10 и CRP, соответственно). Сходство в плане реакции на основе белков организма между пациентами с контрольным стандартом и без контрольного стандарта свидетельствует о том, что настоящий подход может применяться для определения диагноза у пациентов с неопределенным заболеванием в рамках клинических условий.

Эффективность сигнатуры является устойчивой в рамках различных подгрупп пациентов: В Примере 1 авторы настоящего изобретения продемонстрировали, что эффективность сигнатуры оставалась устойчивой в рамках широкого диапазона характеристик пациентов, включая возраст, клинический синдром, время с момента появления симптомов, максимальную температуру, вид патогенов, сопутствующие заболевание и место применения, при этом значения AUC составляли от 0,87 до 1,0 (Фиг. 4). В рамках данного примера приведен обзор эффективности сигнатуры в рамках дополнительных подгрупп пациентов.

Стратификация на основе постоянного приема лекарственных средств: В условиях реальной клинической практики пациенты часто проходят различные курсы лечения с постоянным приемом лекарственных средств, которые потенциально могут влиять на уровень белков, входящих в состав сигнатуры. Таким образом, авторы настоящего изобретения проанализировали влияние наиболее часто применяемых лекарственных средств в рамках группы (по категориям) на эффективность сигнатуры. Ни одна из проанализированных групп лекарственных средств не была связана со значительными измерениями в плане эффективности сигнатуры (Таблица 5).

Стратификация на основе сепсиса: Сепсис представляет собой потенциально летальное медицинское состояние, характеризуемое состоянием воспаления всего организма (называемы синдромом системной воспалительной реакции [SIRS]) и наличием известной или предполагаемой инфекции. Пациенты с бактериальным сепсисом получают пользу от ранней терапии с применением антибиотиков, при этом отсроченное или неправильное определение диагноза может иметь серьезные или даже фатальные последствия. Авторы настоящего изобретения сосредоточились на взрослых пациентах, для которых определение SIRS является очевидным, и проанализировали способность сигнатуры обеспечивать различение взрослых пациентов с бактериальным сепсисом и пациентов с вирусными инфекциями, а также взрослых пациентов с бактериальным сепсисом и пациентов с вирусным сепсисом.

Взрослых пациентов с бактериальным сепсисом определяли в соответствии с критериями Американской коллегии специалистов по заболеваниям грудной полости (American College of Chest Physicians) и Общества работников реаниматологии (Society of Critical Care Medicine). SIRS определяли на основе присутствия, по меньшей мере, двух из следующих результатов: (i) температуры тела <36°C или >38°C, (и) частоты сердечных сокращений >90 ударов в минуту, (iii) интенсивности дыхания >20 вздохов в минуту или на основе давления газа в крови, РаСО2 <32 мм рт.ст. (4,3 кПа) и (iv) WBC<4000 клеток/мм3 или >12000 клеток/мм3 или >10% палочкоядерных нейтрофилов. Было обнаружено, что сигнатура обеспечивала очень высокие уровни точности при различении взрослых пациентов с бактериальным сепсисом и вирусным сепсисом (значение AUC 0,97 и 0,93 для Единогласной [взрослые пациенты с бактериальным сепсисом, взрослые пациенты с вирусным сепсисом] и Мажоритарной [взрослые пациенты с бактериальным сепсисом, взрослые пациенты с вирусным сепсисом] группы, соответственно). Данные результаты демонстрируют применимость сигнатуры при различении взрослых пациентов с бактериальным сепсисом и взрослых пациентов с вирусными инфекциями.

Стратификация пациентов с бактериальным заболеванием и пациентов без бактериального заболевания: Излишнее применение антибиотиков обычно возникает вследствие применения данных лекарственных средств для лечения пациентов с небактериальным (вирусным или неинфекционным) заболеванием или вследствие поздней или отсутствующей диагностики бактериальных инфекций.

Таким образом, авторы настоящего изобретения дополнительно проанализировали эффективность сигнатуры в плане различения пациентов с бактериальным и небактериальным заболеванием. Всю Мажоритарную группу подвергли анализу с применением перекрестной проверки с исключением 10%, что привело к получению значения AUC 0,94±0,.02. Повышенные значения эффективности были продемонстрированы при оценке Единогласной группы (AUC 0,96±0,02) и после исключения пациентов с промежуточной иммунной реакцией (Таблица 7).

Таблица 7. Измерения точности сигнатуры при различении пациентов с бактериальным заболеванием и пациентов с небактериальным (вирусным и неинфекционным) заболеванием. А. Величины эффективности и их 95% доверительные интервалы получали с применением перекрестной провереи с исключением 10% у всех пациентов из Единогласной (nБакт.=256, nНебакт.=383) и Мажоритарной (nБакт.=319, nНебакт.=446) группы. В. Анализ повторяли после исключения пациентов с промежуточной имунной реакцией (Единогласная группа (nБакт.=237, nНебакт.=343, nПромеж..=59) и Мажоритарная группа [nБакт.=292, nНебакт.=387, nПромеж..=86]), что соответствует вероятному способу применения сигнатуры лечащими врачами.

Стабильность белков при различных температурах может влиять на эффективность анализа: Применимость биомаркера зависит от его стабильности в рамках реальных клинических условий (например, скорости его разложения при 20 хранении образца при комнатной температуре перед измерением уровня аналита). Для решения данной проблемы авторы анализировали стабильность TRAIL, CRP и IP-10 в образцах сыворотки от четырех независимых субъектов в течение 24 часов при 4°C и 25°C. Аликвоты по 100 мкл из каждого образца сыворотки переносили с помощью пипетки в 0,2 мл пробирки и хранили при 4°C или 25°C в течение от 0 до 24 часов. Далее измеряли уровни аналитов (в различные моменты времени для одних и тех же аналитов с применением того же планшета и реагентов). Для TRAIL, CRP и IP-10 время полужизни аналитов при 4°C и 25°C составляло более 72 часов (Фиг. 15А-С). Следует отметить, что в рамках реальных клинических условий в случае хранения образцов при комнатной температуре концентрации TRAIL, IP-10 и CRP должны быть измерены в течение примерно 24 часов после получения образца. Предпочтительно они должны быть измерены в течение 5 часов, 4 часов, 3 часов, 2 часов, 1 часа или даже немедленно после получения образца. Альтернативно, образец должен храниться при температуре ниже 10°C, после чего TRAIL может быть измерен в течение более чем 24 часов после получения образца.

Комбинация из трех белков является более эффективной, чем любой отдельный белок и пары белков: Комбинация трех белков является более эффективной, чем отдельные белки и пары белков при различении бактериальных и вирусных заболеваний, и инфекционных и неинфекционных заболеваний.

Анализ эффективности в виде функции распространенности бактериальных инфекций: Распространенность бактериальных и вирусных инфекций зависит от окружающих условий. Например, ожидается, что в зимний период педиатр у амбулаторных больных будет сталкиваться с существенно большим количеством случаев вирусных инфекций, чем лечащий врач в рамках больничного отделения внутренней медицины в летний период. Следует отметить, что некоторые меры диагностической точности, такие как AUC, чувствительность и специфичность, являются инвариантными в плане лежащей в основе распространенности, в то время как меры точности, такие как PPV и NPV, являются зависящими от распространенности. В данном разделе приведен обзор ожидаемой эффективности сигнатуры в плане PPV и NPV в клинических условиях с различной распространенностью бактериальных и вирусных инфекций.

В качестве базиса для данного анализа применяли меры точности сигнатуры, которые получали с применением Единогласной (бактериальное заболевание, вирусное заболевание) и Мажоритарной (бактериальное заболевание, вирусное заболевание) группы. Распространенность бактериальных инфекций в Единогласной группе составляла 51,7% с получением PPV в размере 93%±3% и NPV в размере 93%±3%. Распространенность бактериальных инфекций в Мажоритарной группе составляла 48,7% с получением PPV в размере 89%±3% и NPV в размере 92%±3%.

Измеренную чувствительность и специфичность применяли для вычисления ожидаемых изменений в плане PPV и NPV сигнатуры в виде функции распространенности бактериальных инфекций (Фиг. 14А-В).

Примеры различных клинических условий и экстраполированные значения PPV и NPV сигнатуры для каждого из них приведены в Таблице 10А.

*Средняя ежегодная распространенность. Оценки распространенности бактериальной инфекции основаны на данных, полученных их главы о бактериальной этиологии. 7-я часть учебника Internal Medicine, Harrison, 17-е изд.

Сигнатура превосходит стандартные лабораторные и клинические параметры при диагностике бактериальных и вирусных инфекций: Стандартные лабораторные и клинические параметры, некоторые из которых традиционно применяются в клинической практике для облегчения определения дифференциального диагноза источника инфекции, анализировали у Мажоритарной группы (бактериальное заболевание, вирусное заболевание, неинфекционное заболевание, n=765). Проанализированные параметры включают ANC, % нейтрофилов, % лимфоцитов, WBC и максимальную температуру. В соответствии с хорошо известной клинической ролью данных параметров авторы наблюдали статистически значимое различие в их уровнях между пациентами с бактериальным заболеванием и вирусным заболеванием (Фиг. 15А-Е). Например, пациенты с бактериальным заболеванием имели повышенные уровни ANC (Р<10-24) и WBC (Р<10-10), в то время как пациенты с вирусным заболеванием имели более высокий уровень % лимфоцитов (Р<10-31). Сигнатура являлась значительно более точной, чем любой из отдельных признаков (Р<10-18) и их комбинации (Р<10-15) (см. Фиг. 3А).

Сигнатура превосходит белковые биомаркеры с хорошо известной иммунологической ролью: Сигнатура превзошла все клинические параметры и 600 белков, которые анализировали на этапе скрининга (см. Фиг. 3А-В). В приведенном ниже разделе сигнатура дополнительно сравнивается с выбранными белками, которые традиционно применяются в рамках клинических условий или которые имеют иммунологическую роль.

Одним из наиболее широко применяемых и полезных белковых биомаркеров для различения сепсиса и других неинфекционных случаев SIRS у критически больных пациентов является прокальцитонин (РСТ). Возможность применения РСТ для различения местных бактериальных и вирусных инфекций является менее очевидной. Для анализа этого авторы измеряли концентрации РСТ у 76 произвольно выбранных пациентов из Единогласной (бактериальное заболевание, вирусное заболевание) группы (nБакт.=39, nВирусн.=37) и 101 произвольно выбранных пациентов из Мажоритарной (бактериальное заболевание, вирусное заболевание) группы (nБакт.=51, nВирусн.=50) и сравнивали диагностическую точность на основе уровней РСТ с точностью сигнатуры. Точность РСТ вычисляли с применением стандартных пороговых значений, которые обычно применяют в рамках клинических условий (0,1 нг/мл, 0,25 нг/мл, 0,5 нг/мл и 1 нг/мл).19-23 Максимальная чувствительность РСТ в размере 69% достигалась при пороговом значении 0,1 мг/мл и проводила к получению величины специфичности 62% (для Единогласной [бактериальное заболевание, вирусное заболевание] группы). Для той же группы сигнатура показывала значительно более высокую чувствительность в размере 94% (Р<0,001) и специфичность в размере 93% {Р<0,001) (Фиг. 16А). Сравнение с применением пациентов из Мажоритарной (бактериальной, вирусной) группы показало аналогичные результаты (Фиг. 16 В).

В целом, несмотря на высокую диагностическую и прогностическую ценность в плане детектирования сепсиса у критически больных пациентов, результаты авторов показывают, что РСТ является мене точным при различении пациентов с местными инфекциями (бактериальными инфекциями по сравнению с вирусными инфекциями).

Другой белковый биомаркер, применяемый в рамках клинических условий, представляет собой С-реактивный белок (CRP), являющийся белком реакции острой фазы, уровень которого повышается при инфекциях и других воспалительных условиях. Эффективность CRP сравнивали с эффективностью сигнатуры с применением всей Единогласной (бактериальное заболевание, вирусное заболевание) и Мажоритарной (бактериальное заболевание, вирусное заболевание) групп. Точность CRP определяли с применением нескольких стандартных пороговых значении, применяемых в рамках клинических условии. 26 Максимальную чувствительность CRO в размере 92% получали при пороговом значении 20 мг/мл, что приводило к получению специфичности в размере 60% (для Единогласной [бактериальное заболевание, вирусное заболевание] группы) (Фиг. 17А). Сигнатура имела аналогичную чувствительность (94%) и значительно более высокую специфичность (93%, Р<10-9) в той же группе. Аналогичные результаты наблюдали при применении Мажоритарной (бактериальное заболевание, вирусное заболевание) группы (Фиг. 17 В). В целом, сигнатура имела аналогичную чувствительность относительно CRP при пороговом значении 20 мг/л, однако заметно более высокую специфичность в плане различения пациентов с бактериальным заболеванием и пациентов с вирусным заболеванием.

Далее анализировали дифференциальную реакцию белковых биомаркеров с хорошо известной ролью в плане реакции организма на инфекции (Таблица 10В и Фиг. 18А-Н). Каждый биомаркер тестировали, по меньшей мере, на 43 пациентах (примерно половина - с бактериальным заболеванием и примерно половина - с вирусным заболеванием), при этом если он показывал многообещающие результаты, то его подвергали дальнейшему тестированию на дополнительных пациентах (вплоть до 150).

Поскольку данные биомаркеры не имеют хорошо известного порогового значения в рамках клинических условий, авторы применяли их AUC в качестве базиса для сравнения (Фиг. 3В). Наиболее информативным биомаркером являлся TREM (AUC в размере 0,68±0,09). Точность TREM была значительно ниже, чем точность сигнатуры (Р<10-9 при сравнении двух AUC; Фиг. 3В). Данные результаты показывают, что само по себе участие белка в реакции организма н инфекцию не обязательно обеспечивает диагностическую применимость. Например, несмотря на то, что IFN-γ обладает хорошо известной ролью в плане иммунной реакции на вирусы и внутриклеточные бактерии, его короткий период полужизни (<20 часов)27 ограничивает его диагностическую применимость (поскольку его концентрация в крови сильно зависит от времени с момента возникновения инфекции).

ПРИМЕР 3

Троичный классификатор превосходит двоичный классификатор

В рамках двоичной модели классификатор тренируют путем классификации всех образцов в качестве либо "Бактериальных", либо "Небактериальных" ("Вирусные" и "Неинфекционные" входят в одну группу). В рамках троичной модели классификатор обучается различать три класса: "Бактериальные", "Вирусные" и "Неинфекционные". Вероятность вирусного заболевания и неинфекционного заболевания затем группируют вместе для получения вероятности "небактериального заболевания". Это было продемонстрировано на настоящих данных.

Оба указанных выше классификатора были проанализированы с применением перекрестной проверки с исключением 10% на рамках как Мажоритарной группы, так и Единогласной группы.

РЕЗУЛЬТАТЫ

Применение двоичного классификатора в отношении данных из Мажоритарной группы привело к получению результатов, показанных в Таблице 10C ниже:

Чувствительность классификатора в рамках Мажоритарной группы составляла 80,3%, а специфичность составляла 92,2%.

Применение полиномиального классификатора в отношении того же набора данных привело к получению следующих результатов, указанных в Таблице 10D.

Можно увидеть, что данный классификатор превосходит предыдущий как плане чувствительности, так и в плане специфичности. Чувствительность была повышена до 83,1%, а специфичность - до 93,5%.

Применение двоичного классификатора в отношении данных из Единогласной группы привело к получению результатов, показанных в Таблице 11.

Чувствительность классификатора в Единогласной группе составила 84,8%, а специфичность - 93,5%.

Применение полиномиального классификатора в отношении того же набора данных привело к получению результатов, показанных в Таблице 12.

Данный классификатор превосходит предыдущий как плане чувствительности, так и в плане специфичности. Чувствительность была повышена до 85,2%, а специфичность - до 95,0%.

В целом, троичный классификатор превосходит двоичный классификатор как в плане чувствительности, так и в плане специфичности на обоих протестированных наборах данных.

ПРИМЕР 4

Клиническая точность сигнатуры остается устойчивой даже при снижении аналитической точности

Важно проанализировать влияние повышения CV (стандартное отклонение/среднее значение) уровней белков на клиническую точность, поскольку зачастую различные измерительные устройства, в частности те, которые применяются в местах оказания помощи, показывают повышенные значения CV (что соответствует сниженной аналитической точности).

Авторы настоящего изобретения проанализировали изменение в AUC сигнатуры для различения бактериальной и вирусной инфекции в виде функции повышения CV как TRAIL, так и CRP. Это было осуществлено путем использования исходных данных пациентов из Единогласной группы и симулирования повышения CV с применением симуляций на основе метода Монте-Карло (Фиг. 19А-В). В частности, для каждой комбинации CV TRAIL и CRP каждому пациенту были присвоены 100 симулируемых измерений, при этом осуществляли повторное вычисление AUC в каждом случае. Изображено среднее значение AUC на комбинацию CV. Можно увидеть, что клиническая точность сигнатуры (в плане AUC) является устойчивой в случаях повышения технического CV. Например, повышение CV в рамках ELISA на 0, 0,24 и 0,4 приводит к снижению AUC на 0,96, 0,95 и 0,94, соответственно. Аналогичные результаты были получены при повышении CV IP-10 и повторении симуляций на Мажоритарной группе.

Данный результат может быть объяснен применением множества биомаркеров, которые компенсируют влияние друг друга. Данное удивительное открытие является полезным, так как оно открывает способ осуществления измерений белков с применением дешевых и быстрых технологий (таких как технологии, используемые в местах оказания медицинской помощи), которые зачастую демонстрируют сниженную аналитическую чувствительность (по сравнению с автоматизированными иммуноанализами или ELISA), без утраты клинической точности.

ПРИМЕР 5

Для измерения уровней TRAIL и IP-10 могут применяться различные протоколы ELISA, которые будут приводить к получению различных соотношений сигнал/шум и, соответственно, различных значений измеряемых концентраций. Более конкретно, в то время как общий тренд величин показателей биомаркеров будет сохраняться вне зависимости от протокола (например, TRAIL повышается при вирусных инфекциях и снижается при бактериальных инфекциях), измерительная шкала является зависимой от протокола. В нижеследующих подразделах описаны примеры протоколов, которые приводят к получению различных значений измеряемых концентраций IP-10 и TRAIL.

Измерения уровней растворимого IP-10 и TRAIL с применением ELISA - Протокол №1: Для определения концентраций растворимого IP-10 и TRAIL в образцах плазмы и сыворотки человека применяли стандартный "сэндвич"-анализ ELISA. Кратко, лунки 96-луночного планшета покрывали иммобилизованным антителом, являющимся специфичным по отношению к TRAIL и IP-10, и разводили в буфере для иммобилизации (например, 1×PBS) с последующим инкубированием в течение ночи при 4°C.Лунки дважды промывали промывочным буфером (например, 1×PBS с 0,2% Твин-20) и далее блокировали блокирующим буфером, содержащим белки (например, 1×PBS с 0,2% Твин-20 и 5% обезжиренным молоком) в течение, по меньшей мере, 2 часов при комнатной температуре или в течение ночи при 4°C. Затем лунки дважды промывали промывочным буфером. Белковые стандарты и образцы плазмы или сыворотки инкубировали в течение двух часов при комнатной температуре. Затем лунки промывали три раза промывочным буфером и далее инкубировали с конъюгированным с пероксидазой хрена детектирующим антителом, являющимся специфичным по отношению к TRAIL и IP-10, и разводили в блокирующем буфере в течение двух часов при комнатной температуре.

Лунки промывали четыре раза промывочным буфером и инкубировали с реакционным раствором, который содержал субстрат на основе пероксидазы хрена (например, ТМВ; 3, 3', 5,5'-тетраметилбензидин). После достаточного проявления цвета в каждую лунку добавляли останавливающий раствор. Адсорбцию продукта реакции с пероксидазой хрена при 450 нм определяли с применением стандартного спектрофотометра. Данный протокол занимал 5 (TRAIL) и 4,75 (IP-10) часов, соответственно, и называется здесь "медленным протоколом".

Измерения уровней растворимого IP-10 и TRAIL с применением ELISA - Протокол №2:

Сниженное время проведения анализа обеспечивает повышенную клиническую применимость. Для дальнейшего снижения времени проведения протокола протокол оптимизировали для измерения TRAIL и IP-10 и снижения продолжительности до менее чем 100 минут. Быстрый протокол осуществляли следующим образом:

50 мкл аналитического разбавителя и 50 мкл стандартов добавляли в образцы или контроли в расчете на одну лунку. Реакцию инкубировали в течение 30 минут при комнатной температуре на горизонтальном орбитальном шейкере для микропланшетов (орбита 3 мм) при 550 об/мин. Затем каждую лунку подвергали аспирации и промывали четыре раза с применением промывочного буфера. Затем в каждую лунку добавляли 200 мкл конъюгата и инкубировали реакции в течение 45 минут при комнатной температуре на шейкере. Лунки промывали четыре раза промывочным буфером и инкубировали с реакционным раствором, который содержал субстрат на основе пероксидазы хрена (например, ТМВ; 3, 3', 5,5'-тетраметилбензидин). Спустя 10-25 минут в каждую лунку добавляли останавливающий раствор. Адсорбцию продукта реакции с пероксидазой хрена при 450 нм определяли с применением стандартного спектрофотометра. Данный протокол занимал 99 (TRAIL) и 85 (IP-10) минут, соответственно, и называется здесь "быстрым протоколом".

Измерения, сделанные в рамках медленного и быстрого протокола, сравнивали с применением 357 образцов для TRAIL и 189 образцов для IP-10, при этом они показывали значительно коррелирующие результаты (Фиг. 30А-В).

Следует отметить, что средняя концентрация TRAIL, полученная с применением быстрого протокола, была приблизительно на 70 процентов меньше, чем концентрация, полученная с применением медленного протокола. Подобные изменения в плане измеряемых концентраций белков среди различных протоколов часто возникают и могут быть компенсированы путем коррелирования результатов измерений с применением двух протоколов и вычисления трансформационной функции. Например, трансформационная функция у_медл.=0,709 × у_быстр. - 3е-12 может применяться для перевода концентраций, полученных в рамках быстрого протокола и медленного протокола. Данный перевод обеспечивает сохранение точности TRAIL. Специалистом в данной области могут быть разработаны и другие функции и протоколы для перевода, которые также обеспечивают сохранение точности. В целом, поведение TRAIL остается одинаковым в рамках обоих протоколов (то есть наиболее высокие уровни при вирусном заболевании, более низкие уровни при неинфекционном заболевании и самые низки при бактериальном заболевании) несмотря на различие в плане вычисленных концентраций.

Различные протоколы и группы ведут к различным коэффициентам модели:

В Таблице 13 приведен пример коэффициентов полиномиальной логистической модели, полученных у пациентов из Мажоритарной группы при измерении IP-10 и TRAIL в соответствии с медленным протоколом:

В Таблице 14 приведен пример коэффициентов полиномиальной логистической модели, полученных у пациентов из Единогласной группы при измерении IP-10 и TRAIL в соответствии с медленным протоколом:

Поскольку частота подгрупп в рамках группы пациентов отклоняется от предполагаемой частоты в общей популяции, является возможным провести дальнейгую корректировку коэффициентов модели для отражения предварительно определенного предыдущего значения вероятности с применением стандартных способов корректирования коэффициентов (например, см. G. King and L Zeng, Statistics in Medicine 2002). Например, следующие примеры показывают коэффициенты полиномиальной логистической модели, полученных у пациентов из Мажоритарной группы при измерении IP-10 и TRAIL в соответствии с медленным протоколом, что соответствует предыдущему значению 45% вероятности бактериального заболевания, 45% вероятности вирусного заболевания и 10% вероятности неинфекционного заболевания.

Коэффициенты модели (при тренировке на данных из Мажоритарной группы) после предыдущей корректировки приведены в Таблице 15:

Коэффициенты модели (при тренировке на данных из Единогласной группы) после предыдущей корректировки приведены в Таблице 16.

Следует отметить, что для получения аналогичных результатов могут быть выбраны другие комбинации коэффициентов, как будет очевидно для специалиста в данной области. Другие протоколы измерения уровней белков, которые влияют на концентрации подвергаемых измерению белков будут приводить к получению иных коэффициентов модели. Например, в рамках быстрого протокола для измерения TRAIL вычисляемые концентрации снижаются приблизительно до 70% концентраций, вычисленных в рамках медленного протокола. Таким образом, одним способом корректировки с учетом этого факта является изменение коэффициентов модели TRAIL для учета данного изменения. Другой способ заключается в разделении полученных в рамках быстрого протокола уровней TRAIL на 70% и их применение в рамках указанных выше моделей, которые были разработаны для медленного протокола.

Часто является предпочтительным применение логарифмического преобразования значений уровней белков для повышения точности модели и калибровки (то есть лучшего соответствия с учетом прогнозируемого риска определенной инфекции и наблюдаемого риска).

Пример модели с логарифмическим преобразованием уровней TRAIL и IP-10 указан в Таблице 17 (модель тренировали на Единогласной группе):

ПРИМЕР 6

Параметризация гиперповерхности

С учетом концентраций CRP [С], TRAIL [Т] и IP-10 [Р] определено следующее:

δ0=-1,299+0,0605 × [С]+0,0053 × [Р]+0,0088 × [Т]

δ1=-0,378+0,0875 × [С]+0,0050 × [Р] - 0,0201 × [Т]

Затем значения вероятностей могут быть вычислены следующим образом:

Определим гиперповерхность в [С], [Т], [Р] пространстве

которая применяется для различения пациентов с бактериальным заболеванием и небактериальным заболеванием в одном предпочтительном варианте осуществления изобретения. В других предпочтительных вариантах осуществления изобретения на основе значений пациента [С], [Т], [Р] его классифицируют как имеющего бактериальное заболевание, если , иначе его/ее классифицируют в качестве не имеющего (не имеющей) бактериального заболевания.

Авторы определили набор всех гиперплоскостей, которые могут применяться для различения бактериальных и небактериальных инфекций в виде результатов, расположенных на следующих двух гиперповерхностях:

1 может представлять собой любое число от 0 до 1-. В некоторых предпочтительных вариантах осуществления ∈1 составляет менее 0,5, 0,4, 0,3, 0,2 или 0,1.

0 может представлять собой любое число от 0 до ω. В некоторых предпочтительных вариантах осуществления ∈0 составляет менее 0,5, 0,4, 0,3, 0,2 или 0,1.

Иллюстрированные примеры поверхностей приведены в Примере 7.

ПРИМЕР 7 Графическое представление классификации

Фиг. 20 представляет собой трехмерную визуализацию пациентов с бактериальным заболеванием ('+'), вирусным заболеванием ('о') и неинфекционным заболеванием ('^'). Разные типы пациентов нанесены на различные участки на карте концентрации CRP (мкг/мл), TRAIL и IP-10 (пг/мл).

В качестве примера были получены поверхности со значениями вероятностей с применением полиномиальной логистической регрессии. Контурные диаграммы поверхностей показаны на Фиг. 21А-28С в виде функции концентраций TRAIL (ось у), CRP (ось х) и IP-10. На Фиг. 21А, 22А, 23А, 24А, 25А, 26А, 27А, 28А показаны вероятности наличия вирусных инфекций, на Фиг. 21В, 22В, 23В, 24В, 25В, 26В, 27В, 28В показаны вероятности наличия бактериальных или смешанных инфекций, а на Фиг. 21С, 22С, 23С, 24С, 25С, 26С, 27С, 28С показаны вероятности наличия неинфекционных заболеваний или здоровые субъекты. Фиг. 21А-С соответствуют IP-10 в диапазоне от 0 до 100 пг, Фиг. 22А-С соответствуют IP-10 в диапазоне от 100 до 200 пг, Фиг. 23А-С соответствуют IP-10 в диапазоне от 200 до 300 пг, Фиг. 24А-С соответствуют IP-10 в диапазоне от 300 до 400 пг, Фиг. 25А-С соответствуют IP-10 в диапазоне от 400 до 500 пг, Фиг. 26А-С соответствуют IP-10 в диапазоне от 500 до 1000 пг, Фиг. 27А-С соответствуют IP-10 в диапазоне от 1000 до 2000 пг и Фиг. 28А-С соответствуют IP-10 в диапазоне от 2000 пг и выше.

Пациенты с бактериальной или смешанной инфекцией отмечены в виде '+'; с вирусной инфекцией - в виде 'о', а с неинфекционным заболеванием или здоровые - в виде '^'. Можно увидеть, что низкие уровни IP-10 ассоциированы с неинфекционным заболеванием, более высокие уровни - с бактериальным заболеванием, а самые высокие - с вирусным заболеванием. Низкие уровни TRAIL ассоциированы с бактериальными инфекциями, более высокие уровни - с неинфекционным заболеванием или здоровыми субъектами, а самые высокие - с вирусным заболеванием. Низкие уровни CRP ассоциированы с неинфекционным заболеванием и здоровыми субъектами, более высокие - с вирусной инфекцией, а самые высокие - с бактериальной инфекцией. Комбинация из трех белков позволяет получать функцию вероятности, чья диагностическая эффективность превосходит любой из отдельных белков или пар белков.

Фиг. 35А-D представляют собой контурные диаграммы, описывающие вероятность наличия заболевания бактериальной (Фиг. 35А), вирусной (Фиг. 35В), небактериальной (Фиг. 35С) и неинфекционной (Фиг. 35D) этиологии в виде функции координат δ0 и δ1. Значения вероятности лежат в диапазоне от 0% (черные) до 100% (белые).

ПРИМЕР 8

Примеры протоколов для измерения уровней экспрессии

В целом, без ограничения, значение экспрессии TRAIL может быть измерено с применением ELISA или автоматизированного иммуноанализа; значение экспрессии IP-10 может быть измерено с применением анализа ELISA; а значение экспрессии CRP может быть измерено с применением ELISA или автоматизированного иммуноанализа. Значение экспрессии CRP также может быть измерено с применением функционального анализа, основанного на его кальцийзависимом связывании с фосфорилхолином.

Протокол А;

Подходящий протокол для измерения значения экспрессии TRAIL

(a) иммобилизация TRAIL, присутствующего в образце, с применением антитела на твердой подложке;

(b) контактирование иммобилизованного TRAIL со вторым антителом, которое специфично связывается с TRAIL; и

(c) количественный анализ антитела, которое связалось с иммобилизованным TRAIL.

Подходящий протокол для измерения значения экспрессии IP-10

(a) иммобилизация IP-10, присутствующего в образце, с применением иммобилизованного антитела на твердой подложке;

(b) контактирование иммобилизованного IP-10 со вторым антителом, которое специфически связывается с IP-10; и

(c) количественный анализ антитела, которое связалось с иммобилизованным IP-10.

Подходящий протокол для измерения значения экспрессии CRP

(а) иммобилизация CRP, присутствующего в образце, с применением иммобилизованного антитела на твердой подложке;

(b) контактирование иммобилизованного CRP со вторым антителом, которое специфически связывается с CRP; и

(c) количественный анализ антитела, которое связалось с иммобилизованным CRP.

Протокол В;

Подходящий протокол для измерения значения экспрессии TRAIL

(a) Инкубирование образца с первым антителом, которое специфически связывается с TRAIL, при этом указанное первое антитело иммобилизовано на твердой подложке;

(b) Промывание;

(c) Добавление второго антитела, которое специфически связывается с TRAIL, при этом второе антитело конъюгировано с ферментом; промывание

(d) Добавление ферментативного субстрата и количественный анализ антитела, которое связалось с иммобилизованным образцом.

Подходящий протокол для измерения значения экспрессии IP-10

(a) Инкубирование образца с первым антителом, которое специфически связывается с IP-10, при этом указанное первое антитело иммобилизовано на твердой подложке;

(b) Промывание;

(c) Добавление второго антитела, которое специфически связывается с IP-10, при этом второе антитело конъюгировано с ферментом; промывание

(d) Добавление ферментативного субстрата и количественный анализ антитела, которое связалось с иммобилизованным образцом.

Подходящий протокол для измерения значения экспрессии CRP

(a) Инкубирование образца с первым антителом, которое специфически связывается с CRP, при этом указанное первое антитело иммобилизовано на твердой подложке;

(b) Промывание;

(c) Добавление второго антитела, которое специфически связывается с CRP, при этом второе антитело конъюгировано с ферментом; промывание

(d) Добавление ферментативного субстрата и количественный анализ антитела, которое связалось с иммобилизованным образцом.

Протокол С:

Подходящий протокол для измерения значения экспрессии CRP

(a) измерение помутнения смеси липидов;

(b) контактирование образца с известным количеством липидов (предпочтительно фосфорилхолина) в присутствии кальция; и

(c) измерение помутнения раствора, при этом повышение помутнения коррелирует с количеством CRP.

ПРИМЕР 9

Подробное описание ELISA для анализа количества TRAIL и IP-10

Сбор и хранение образцов: Подвергание образцов действию комнатной температуры должно быть минимизировано (менее 6 часов). Применяли пробирку для отделения сыворотки (SST) и оставляли образцы для образования сгустков в течение, по меньше мере, 30 минут после центрифугирования (5 минут при 1200 × g). Сыворотка может быть проанализирована немедленно или подвергнута аликвотированию и хранению при 4-8°C в течение времени до 24 часов или при ≤-20°C в течение времени до 3 месяцев. Повторных циклов замораживания и оттаивания следует избегать.

Подготовка реагентов: Все реагенты должны быть доведены до комнатной температуры перед применением.

Субстратный раствор: Цветные реагенты А и В должны быть смешаны вместе в равных объемах в рамках 10 минут перед применением. Следует обеспечивать защиту от света.

QC-1V, QC-2B и стандарты: Следует разморозить все QC и стандарты и удалить 150 мкл из каждого флакона в отдельную промаркированную полипропиленовую тестовую пробирку. После применения следует немедленно поместить их обратно под действие температуры -20°C.

Измерения TRAIL:

Материалы, применяемые для анализа TRAIL, указаны в Таблице 18 ниже.

Процедура ELISA TRAIL

a) Подготовить образцы, реагенты и стандарты, как указано выше.

b) Удалить избыточные стрипы с рамки планшета, положить их обратно в пакет из фольги, содержащий водопоглотитель, и закрыть.

c) Добавить 50 мкл аналитического разбавителя MM1S в каждую лунку.

d) Добавить 50 мкл стандарта, образцов или QC в каждую лунку. Накрыть сверху адгезивным стрипом.

e) Инкубировать в течение 30 минут при комнатной температуре на шейкере для микропланшетов (орбита 3 мм) при 550 об/мин.

f) Подвергнуть каждую лунку аспирации и промыть; повторить процесс 4 раза. Промыть путем заполнения каждой лунки промывочным буфером (300 мкл).

После последнего промывания удалить любой оставшийся промывочный буфер с помощью аспирации или декантации. Перевернуть планшет и осуществить блоттинг с использованием чистых бумажных полотенец.

g) Добавить 200 мкл конъюгата TRAIL в каждую лунку. Накрыть новым адгезивным стрипом. Инкубировать в течение 45 минут при комнатной температуре на шейкере для микропланшетов (орбита 3 мм) при 550 об/мин.

h) Повторить аспирацию/промывание как на стадии (g).

i) Добавить 200 мкл субстратного раствора в каждую лунку. Инкубировать в течение от 24 до 30 минут при комнатной температуре. Обеспечить защиту от света.

j) Добавить 20 мкл раствора для остановки в каждую лунку. Цвет в лунках должен измениться с синего на желтый. Если цвет в лунках является зеленым или изменение цвета не является равномерным, следует осторожно постучать по планшету для обеспечения тщательного смешивания.

k) Немедленно определить оптическую плотность каждой лунки с применением сканера для микропланшетов, настроенного на 450 нм. Установить величину корректировки длины волны на 570 нм, что будет обеспечивать корректировку оптических изъянов в планшете.

Вычисление концентраций TRAIL: Усреднить дублированные показания для каждого образца и вычесть оптическую плотность нулевого стандарта (O.D.). Создать стандартную кривую путем нанесения средней величины адсорбции для каждого стандарта (ось y) относительно концентрации (ось x) и построить аппроксимированную линейную кривую. Минимальное значение r2 не должно падать ниже 0,96. В случае наличия более низких значений r2 следует повторить эксперимент для получения надежных результатов.

Прецизионность: Прецизионность оценивали на основе руководств ЕР05-А2 Института клинических и лабораторных стандартов США (CLSI) (бывш. Национальный комитет по клиническим лабораторным стандартам США, NCCLS). Для анализа прецизионности применяли три образца с низкими (11,4 пг/мл), промежуточными (58,8 пг/мл) и высокими (539,9 пг/мл) физиологическими концентрациями. Результаты приведены в Таблице 19, где Sr представляет собой межсерийную прецизионность, a ST представляет собой межлабораторную прецизионность:

Степень извлечения: Степень извлечения оценивали путем добавления трех уровней рекомбинантного TRAIL человека (250, 125 и 62,5 пг/мл) к 5 образцам сыворотки человека без детектируемых уровней TRAIL. Затем измеряли и вычисляли подвергнутые добавлению значения и среднюю степень извлечения, как показано в Таблице 20 ниже.

Линейность: Для анализа линейности исследования пять клинических образцов, содержащих высокие концентрации TRAIL, подвергали последовательному разбавлению с применением заменителя сыворотки для получения образцов со значениями в рамках физиологического диапазона исследования. Линейность в среднем составляла 97%, 100%) и 105% для 1:2, 1:4 и 1:8 разбавлений, соответственно, как указано в Таблице 21 ниже.

Чувствительность: Для анализа Предела измерения холостого образца (Limitation of Blank, LOB) авторы протестировали 72 холостых образца заменителя сыворотки. Среднее значение холостых образцов составляло 0,78 пг/мл, а стандартное отклонение составляло 1,39 пг/мл. Таким образом, вычисленный LOB составлял 3,07 пг/мл.

Для анализа Предела обнаружения (Limitation of Detection, LOD) следовали руководствам CLSI ЕР17-А. Кратко, было охарактеризовано распределение результатов вокруг семи предварительно определенных концентраций, каждой из которых соответствовали 30 независимых результатов (всего 210 результатов), с получением значения LOD 10 пг/мл.

Калибровка: В рамках данного иммуноанализа проводили калибровку относительно очищенного экспрессированного NS0 рекомбинантного TRAIL человека.

Ожидаемые значения: Образцы, полученные от очевидно здорового взрослого субъекта (в возрасте >18 лет), подвергали анализу на наличие TRAIL. Значения диапазона и средний величины приведены в Таблице 22.

Перекрестная реактивность и интерференция: Данный анализ обеспечивает различение естественного и рекомбинантного TRAIL человека. Факторы 4-1 ВВ лиганд, APRIL, BAFF/BLyS, CD27 лиганд, CD30 лиганд, CD40 лиганд, Fas лиганд, GITR лиганд, LIGHT, LT α1/β2,LT α2/β1,OPG,OX40 лиганд, TNF-α, TNF-β, TRAIL R3, TRAIL R4, TRANCE и TWEAK получали в количестве 5 50 нг/мл в заменителе сыворотки и анализировали на перекрестную реактивность. Дополнительно, препараты на основе данных факторов в количестве 50 пг/мл в контроле на основе рекомбинантного TRAIL человека среднего диапазона тестировали на интерференцию. Значительная перекрестная реактивность или интерференция не наблюдалась.

Измерения уровня IP-10: Материалы, применяемые для анализа IP-10, указаны в Таблице 23 ниже.

Процедура ELISA IP-10

a) Подготовить образцы, реагенты и стандарты, как указано выше.

b) Удалить избыточные стрипы с рамки планшета, положить их обратно в пакет из фольги, содержащий водопоглотитель, и закрыть.

c) Добавить 50 мкл аналитического разбавителя ММ56 в каждую лунку.

d) Добавить 50 мкл стандарта, образцов или QC в каждую лунку. Накрыть сверху адгезивным стрипом.

e) Инкубировать в течение 30 минут при комнатной температуре на шейкере для микропланшетов (орбита 3 мм) при 550 об/мин.

f) Подвергнуть каждую лунку аспирации и промыть; повторить процесс 4 раза. Промыть путем заполнения каждой лунки промывочным буфером (300 мкл). После последнего промывания удалить любой оставшийся промывочный буфер с помощью аспирации или декантации. Перевернуть планшет и осуществить блоттинг с использованием чистых бумажных полотенец.

g) Добавить 200 мкл конъюгата IP-10 в каждую лунку. Накрыть новым адгезивным стрипом. Инкубировать в течение 45 минут при комнатной температуре на шейкере для микропланшетов (орбита 3 мм) при 550 об/мин.

h) Повторить аспирацию/промывание как на стадии (g).

i) Добавить 200 мкл субстратного раствора в каждую лунку. Инкубировать в течение 10 минут при комнатной температуре. Обеспечить защиту от света.

j) Добавить 50 мкл раствора для остановки в каждую лунку. Цвет в лунках должен измениться с синего на желтый. Если цвет в лунках является зеленым или изменение цвета не является равномерным, следует осторожно постучать по планшету для обеспечения тщательного смешивания.

k) Немедленно определить оптическую плотность каждой лунки с применением сканера для микропланшетов, настроенного на 450 нм.

Установить величину корректировки длины волны на 570 нм, что будет обеспечивать корректировку оптических изъянов в планшете.

Вычисление концентраций IP-10: Усреднить дублированные показания для каждого образца и вычесть оптическую плотность нулевого стандарта (O.D.). Создать стандартную кривую путем нанесения средней величины адсорбции для каждого стандарта (ось y) относительно концентрации (ось x) и построить аппроксимированную линейную кривую. Минимальное значение r2 не должно падать ниже 0,96. В случае наличия более низких значений r2 следует повторить эксперимент для получения надежных результатов.

Прецизионность: Прецизионность оценивали на основе руководств ЕР05-А2 Института клинических и лабораторных стандартов США (CLSI) (бывш. Национальный комитет по клиническим лабораторным стандартам США, NCCLS). Для анализа прецизионности применяли три образца с низкими (69,4 пг/мл), промежуточными (228,2 пг/мл) и высокими (641,5 пг/мл) физиологическими концентрациями. Результаты приведены в Таблице 24, где Sr представляет собой межсерийную прецизионность, a ST представляет собой межлабораторную прецизионность:

Степень извлечения: Степень извлечения оценивали путем добавления трех уровней IP-10 человека, 500, 250 и 125 пг/мл, к 5 образцам сыворотки человека без детектируемых уровней IP-10. Затем измеряли и вычисляли подвергнутые добавлению значения и среднюю степень извлечения, как показано в Таблице 25 ниже.

Линейность: Для анализа линейности анализа IP-10 пять клинических образцов, содержащих высокие концентрации IP-10 в диапазоне от 873,7 до 1110,4 пг/мл, подвергали последовательному разбавлению с применением заменителя сыворотки для получения образцов со значениями в рамках физиологического диапазона исследования. Линейность в среднем составляла 98%, 102%) и 104%) для 1:2, 1:4 и 1:8 разбавлений, соответственно, как указано в Таблице 26 ниже.

Чувствительность: Для анализа Предела измерения холостого образца (Limitation of Blank, LOB) авторы протестировали 72 холостых образца заменителя сыворотки. Среднее значение холостых образцов составляло 0,23 пг/мл, а стандартное отклонение составляло 1,26 пг/мл, что приводило к получению значения LOB 2,29 пг/мл.

Для анализа Предела обнаружения (Limitation of Detection, LOD) следовали руководствам CLSI ЕР17-А. Кратко, было охарактеризовано распределение результатов вокруг семи предварительно определенных концентраций, каждой из которых соответствовали 30 независимых результатов (всего 210 результатов), с получением значения LOD 10 пг/мл.

Калибровка: В рамках данного иммуноанализа проводили калибровку относительно высокоочищенного экспрессируемого E-coli рекомбинантного IP-10 человека.

Ожидаемые значения: Образцы, полученные от очевидно здоровых добровольцев, подвергали анализу на наличие IP-10. Значения диапазона и средний величины приведены в Таблице 27 ниже.

Перекрестная реактивность и интерференция: ТДанный анализ обеспечивает различение естественного и рекомбинантного IP-10 человека. Факторы BLC/BCA-1, ENA-78, GCP-2, GROα, GROγ, IFN-γ, IL-8, I-TAC, MIG, NAP-2, SDF-1α и SDF-1β получали в количестве 50 нг/мл в заменителе сыворотки и анализировали на перекрестную реактивность. Дополнительно, препараты на основе данных факторов в количестве 50 пг/мл в контроле на основе рекомбинантного IP-10 человека среднего диапазона тестировали на интерференцию. Значительная перекрестная реактивность или интерференция не наблюдалась.

ПРИМЕР 10

TRAIL И ПРОГНОЗ РАЗВИТИЯ ЗАБОЛЕВАНИЯ

Часто является полезным с клинической точки зрения проанализировать у пациентов прогноз, тяжесть заболевания и конечный исход. Авторы настоящего изобретения определили, что низкие уровни TRAIL значительно коррелируют с плохим прогнозом и конечным исходом у пациента, а также с высокой тяжестью заболевания. Например, взрослые пациенты в отделении интенсивной терапии (ICU) имели значительно более низкие уровни TRAIL по сравнению со всеми другими пациентами, которые были менее больными вне зависимости от инфекционной или неинфекционной этиологии заболевания. Медианные значения концентрации в сыворотке составляли 9 пг/мл против 80 пг, соответственно (p-значение ранговой суммы <0,001, Фиг. 36А), для тяжелобольных пациентов и остальных пациентов, соответственно.

40 пациентов детского возраста из Нидерландов в возрасте от 3 месяцев до 5 лет. Уровень TRAIL в сыворотке измеряли у 40 пациентов детского возраста из Нидерландов в возрасте от 3 месяцев до 5 лет. Было обнаружено, что пациенты, которые соответствовали критериям поступления в ICU (что являлось признаком осложнения заболевания и плохого прогноза) или даже умирали, имели значительно более низкие концентрации TRAIL в сыворотке по сравнению с остальными пациентами (медиана 11 против 85, соответственно, P-значение ранговой суммы Р<0,001), как изображено на Фиг. 36В. Удивительно, что наиболее низкие уровни TRAIL (<5 пг/мл) определяли только у двух детей из всей группы, которые умерли. Данные результаты свидетельствуют о том, что TRAIL может применяться в качестве прогностического маркера для прогнозирования тяжести заболевания и конечного исхода.

ПРИМЕР 11

TRAIL - ПАРАМЕТРЫ ВОЗРАСТА И ПОЛА

Базальные уровни TRAIL у здоровых субъектов или пациентов с неинфекционным заболеванием являются более низкими у женщин по сравнению с мужчинами в рамках детородного возраста (P-значение t-теста<0,001) (см. Фиг. 37А), однако не различаются в рамках пре- или пост-детородного возраста (Р-значение t-теста=0,9, Фиг. 37А). Данный тренд не наблюдался у пациентов с инфекционным заболеванием.

ПРИМЕР 12

Примеры многообразий, гиперплоскостей и координат

Одномерное многообразие

Если n=1, то многообразие S представляет собой кривую, а гиперплоскость π представляет собой ось, образующую одно направление δ1. Координата δ1 в данном Примере необязательно и предпочтительно представляет собой линейную комбинацию b0+b1D1+b2D2+… полипептидов D1, D2 и так далее.

В Таблице 28 ниже перечислены показатели диагностической эффективности (в виде AUC), достигнутые при n=1. Показатели эффективности вычисляли с применением перекрестной проверки с исключением 10% на группе, указанной в каждой строке. В строках 1-4 анализируемые субъекты имели либо бактериальные или вирусные инфекции и осуществлялось вычисление координаты δ1, таким образом что функция вероятностной классификации f(δ1) отражала вероятность того, что тестируемый субъект имел бактериальную инфекцию. В строках 5-8 анализируемые субъекты имели либо инфекционные или неинфекционные заболевания и осуществлялось вычисление координаты δ1, таким образом что функция вероятностной классификации f(δ1) отражала вероятность того, что тестируемый субъект имел инфекционное заболевание. В строках 10-12 анализируемые субъекты имели бактериальную или небактериальную инфекцию и осуществлялось вычисление координаты δ1, таким образом что функция вероятностной классификации f(δ1) отражала вероятность того, что тестируемый субъект имел бактериальную инфекцию. В строках 1-4 столбцы Р и N соответствуют количеству пациентов с бактериальным и вирусным заболеванием, соответственно, в строках 5-8 столбцы Р и N соответствуют количеству пациентов с инфекционным и неинфекционным заболеванием, соответственно, а в строках 9-12 столбцы Р и N соответствуют количеству пациентов с бактериальным и небактериальным заболеванием, соответственно. "Мажоритарная" и "Единогласная" указывают на тип группы, в рамках которой была проверена модель.

В Таблице 29 ниже перечислены коэффициенты b0, b1, b2 и так далее, которые применяли для определения координаты δ1, для каждого из 12 случаев, перечисленных в Таблице 28, соответственно. Первый коэффициент слева представляет собой b0 и затем слева направо указаны коэффициенты, соответствующие порядку полипептидов в каждой строке Таблицы 28. Коэффициенты соответствуют следующим показателям концентрации для каждого полипептида: TRAIL (пг/мл), IP-10 (пг/мл) и CRP (мкг/мл).

Для указанного набора полипептидов полученные коэффициенты обладают небольшими вариациями среди разных групп. Тем не менее, коэффициенты для функций вероятностной классификации и координаты в рамках настоящих вариантов осуществления изобретения предпочтительно соответствуют тем, которые были получены для Мажоритарной группы.

В Таблице 30 ниже перечислены показатели диагностической эффективности (в AUC), полученные для одномерного многообразия. Показатели эффективности вычисляли с применением перекрестной проверки с исключением 10% на Мажоритарной группе. В строках 1-55 анализируемые субъекты имели либо бактериальные или вирусные инфекции, а функция вероятностной классификации f(δ1) отражала вероятность того, что тестируемый субъект имел бактериальную инфекцию. В строках 56-110 анализируемые субъекты имели либо инфекционные или неинфекционные заболевания, а функция вероятностной классификации f(δ1) отражала вероятность того, что тестируемый субъект имел инфекционное заболевание. В строках 1-55 столбцы Р и N соответствуют количеству пациентов с бактериальным и вирусным заболеванием, соответственно, а в строках 56-110 столбцы Р и N соответствуют количеству пациентов с инфекционным и неинфекционным заболеванием, соответственно.

В Таблице 31 ниже перечислены коэффициенты b0, b1, b2 и так далее, которые применяли для определения координаты δ1, для каждого из 110 случаев, перечисленных в Таблице 30, соответственно. Первый коэффициент слева представляет собой b0 и затем слева направо указаны коэффициенты, соответствующие порядку полипептидов в каждой строке Таблицы 30.

Коэффициенты соответствуют следующим показателям концентрации для каждого полипептида: TRAIL (пг/мл), IP-10 (пг/мл), CRP (мкг/мл), РСТ (нг/мл), SAA (г/мл) и IL1ra (г/мл).

Двумерное многообразие

Если n=2, то многообразие S представляет собой кривую поверхность, а гиперплоскость π представляет собой плоскую плоскость, образованную первым направлением δ0 и вторым направлением δ1. Координата δ0 в данном Примере необязательно и предпочтительно представляет собой линейную комбинацию a0+a1D1+a2D2+… полипептидов D1, D2 и так далее; а координата δ1 в данном Примере необязательно и предпочтительно представляет собой линейную комбинацию b0+b1D1+b2D2+… полипептидов D1, D2 и так далее.

В Таблицах 32-35 ниже перечислены показатели диагностической эффективности (в AUC), полученные для случая n=2. Показатели эффективности вычисляли с применением перекрестной проверки с исключением 10% на подмножестве Мажоритарной группы, которое имело достаточное количество сыворотки для измерения уровней всех белков. Вычисляли координаты δ0 и δ1, таким образом что функция вероятностной классификации f(δ01) отражала вероятность того, что тестируемый субъект имел бактериальную инфекцию. Значения AUC соответствуют классификациям в соответствии с условием Бактериальное заболевание/Вирусное заболевание (второй столбец справа - Б/В) и Инфекционное заболевание/Неинфекционное заболевание (самый левый столбец - И/НИ). Показаны результаты для вариантов осуществления, в рамках которых множество полипептидов включает два полипептида (Таблица 32), три полипептида (Таблица 33), четыре полипептида (Таблица 34) и пять полипептидов (Таблица 35). Для каждого полипептида указаны коэффициенты для координат δ0 и δ1, при этом "Конст." соответствует а0 при применении в отношении координаты δ0 и b0 при применении в отношении координаты δ1. Коэффициенты соответствуют следующим показателям концентрации для каждого белка: TRAIL (пг/мл), IP-10 (пг/мл), CRP (мкг/мл), РСТ (нг/мл), SAA (г/мл) и IL1ra (г/мл).

ПРИМЕР 13

Примеры координат, которые включают нелинейные функции

Авторами настоящего изобретения неожиданно было обнаружено, что включение нелинейных функций φ0 и φ1 при вычислении координат δ1 и δ2 позволяет охватывать большее количество неочевидных трендов в данных, в то же время обеспечивая сохранение вероятностного каркаса, способствующего содержательной интерпретации результатов. В данном Примере координаты δ0 и δ1 вычисляли в соответствии со следующими уравнениями:

δ001С+a2I+a3T+φ0

δ1=b0+b1C+b2I+b3T+φ1,

а нелинейные функции были определены как:

φ0=q1Cγ1+q2Cγ2+q3Tγ3

φ1=r1Cγ1+r2Cγ2+r3Tγ3.

где γ1=0.5, γ2=2 и γ3=0.5.

В Таблице 36 приведены коэффициенты и константы, используемые в рамках данного Примера.

Эффективность модели, представленной в Таблице 36, анализировали на Группе с подтвержденным микробиологическим диагнозом (AUC 0,95±0,03), Единогласной группе (AUC 0,95±0,02) и Исследуемой группе (AUC 0,93±0,02). Эффективность сигнатуры повышалась с ростом размера экивокального участка.

В Таблицах 37А-С ниже показаны меры точности сигнатуры при диагностике бактериальных и вирусных инфекций при использовании нелинейной модели настоящего Примера. Величины эффективности и их 95% доверительные интервалы были получены на Подгруппе с подтвержденным микробиологическим диагнозом (Таблица 37А; n=241), Единогласной подгруппе (Таблица 37В; n=527) и Исследуемой группе (Таблица 37С; n=653) с применением различных размеров экивокальных участков, как указано. В Таблицах 37D-F ниже показаны процентные доли пациентов в Исследуемой группе, имеющих экивокальные иммунные реакции, при использовании различных пороговых значений, а в Таблицах 37G-H ниже показана чувствительность и специфичность сигнатуры при использовании различных пороговых значений экивокальных иммунных реакций, полученных в рамках Исследуемой группы. В Таблицах 37D-H самые левые столбцы соответствуют минимальному пороговому значению экивокальной иммунной реакции, а самая верхняя строка соответствует максимальному пороговому значению экивокальной иммунной реакции.

Эффективность сигнатуры также анализировали на Исследуемой группе при исключении следующих двух подгрупп: (i) пациентов, чьи образцы крови были получены спустя более чем 3 дня лечения антибиотиком в больнице и (ii) пациентов с предполагаемым гастроэнтеритом. Сведения об эффективности модели у Группы с подтвержденным микробиологическим диагнозом (AUC 0,96±0,04), Единогласной группы (AUC 0,96±0,02) и Исследуемой группы (AUC 0,95±0,02) указаны далее в Таблицах 38А-С.

В таблицах 38А-С указаны меры точности сигнатуры в плане диагностики бактериальных и вирусных инфекций с применением нелинейной MLR модели. Анализы эффективности и их 95% доверительные интервалы получали для Подгруппы с подтвержденным микробиологическим диагнозом (Таблица 38А; n=200), Единогласной подгруппы (Таблица 38 В; n=402) и Исследуемой группы (Таблица 38С; n=491) при исключении пациентов, которые подвергались лечению антибиотиками в течение более 3 дней в больнице и/или имеющих предполагаемый гастроэнтерит.

ПРИМЕР 14

Стратификация на основе антибиотиков

Из 653 пациентов с подозрением на острую инфекцию 427 получали антибиотики (299 имели диагностированное бактериальное заболевание и 128 имели диагностированное вирусное заболевание). AUC сигнатуры для различения пациентов с бактериальной и вирусной инфекцией в рамках подгруппы пациентов, подвергаемых лечению антибиотиками, составляла 0,93±0,02. Статистически значимое различие между эффективностью у подгруппы подвергаемых лечению антибиотиками пациентов и общей группой не наблюдалось (0,94±0,02 против 0,93±0,02; Р=0,5).

Несмотря на то, что изобретение было описано в рамках определенных вариантов его осуществления, специалистам в данной области будут очевидны многие его альтернативы, модификации и вариации. Соответственно, оно предполагает охват всех подобных альтернатив, модификаций и вариаций, которые соответствуют духу и области, определенной прилагаемой формулой изобретения.

Все публикации, патенты и патентные заявки, указанные в данном описании, полностью приведены здесь для ссылки в той же степени, как если бы каждая отдельная публикация, патент или патентная заявка была явно и отдельно указана для включения для ссылки. Кроме того, цитирование или указание любой ссылки в данном описании не должно рассматриваться в качестве допущения того, что подобная ссылка является доступной в качестве уровня техники по отношению к настоящему изобретению. Заголовки разделов в их приведенном здесь виде не должны рассматриваться в качестве обязательно ограничивающих.

--->

перечень последовательностей

<110> МЕМЕД ДИАГНОСТИКС ЛТД.

ЭДЕН, Эран

ОВЕД, Кфир

НАВОН, Рой

КОЭН-ДОТАН, Ассаф

БОЙКО, Ольга

<120> ВЫЧИСЛИТЕЛЬНЫЙ АНАЛИЗ БИОЛОГИЧЕСКИХ ДАННЫХ С ПРИМЕНЕНИЕМ МНОГООБРАЗИЯ И ГИПЕРПЛОСКОСТИ

<130> 62853

<150> US 62/037,180

<151> 2014-08-14

<150> US 62/105,938

<151> 2015-01-21

<160> 38

<170> PatentIn version 3.5

<210> 1

<211> 1953

<212> DNA

<213> Homo sapiens

<400> 1

acagaaccca gaaaaacaac tcattcgctt tcatttcctc actgactata aaagaataga 60

gaaggaaggg cttcagtgac cggctgcctg gctgacttac agcagtcaga ctctgacagg 120

atcatggcta tgatggaggt ccagggggga cccagcctgg gacagacctg cgtgctgatc 180

gtgatcttca cagtgctcct gcagtctctc tgtgtggctg taacttacgt gtactttacc 240

aacgagctga agcagatgca ggacaagtac tccaaaagtg gcattgcttg tttcttaaaa 300

gaagatgaca gttattggga ccccaatgac gaagagagta tgaacagccc ctgctggcaa 360

gtcaagtggc aactccgtca gctcgttaga aagatgattt tgagaacctc tgaggaaacc 420

atttctacag ttcaagaaaa gcaacaaaat atttctcccc tagtgagaga aagaggtcct 480

cagagagtag cagctcacat aactgggacc agaggaagaa gcaacacatt gtcttctcca 540

aactccaaga atgaaaaggc tctgggccgc aaaataaact cctgggaatc atcaaggagt 600

gggcattcat tcctgagcaa cttgcacttg aggaatggtg aactggtcat ccatgaaaaa 660

gggttttact acatctattc ccaaacatac tttcgatttc aggaggaaat aaaagaaaac 720

acaaagaacg acaaacaaat ggtccaatat atttacaaat acacaagtta tcctgaccct 780

atattgttga tgaaaagtgc tagaaatagt tgttggtcta aagatgcaga atatggactc 840

tattccatct atcaaggggg aatatttgag cttaaggaaa atgacagaat ttttgtttct 900

gtaacaaatg agcacttgat agacatggac catgaagcca gtttttttgg ggccttttta 960

gttggctaac tgacctggaa agaaaaagca ataacctcaa agtgactatt cagttttcag 1020

gatgatacac tatgaagatg tttcaaaaaa tctgaccaaa acaaacaaac agaaaacaga 1080

aaacaaaaaa acctctatgc aatctgagta gagcagccac aaccaaaaaa ttctacaaca 1140

cacactgttc tgaaagtgac tcacttatcc caagagaatg aaattgctga aagatctttc 1200

aggactctac ctcatatcag tttgctagca gaaatctaga agactgtcag cttccaaaca 1260

ttaatgcaat ggttaacatc ttctgtcttt ataatctact ccttgtaaag actgtagaag 1320

aaagagcaac aatccatctc tcaagtagtg tatcacagta gtagcctcca ggtttcctta 1380

agggacaaca tccttaagtc aaaagagaga agaggcacca ctaaaagatc gcagtttgcc 1440

tggtgcagtg gctcacacct gtaatcccaa cattttggga acccaaggtg ggtagatcac 1500

gagatcaaga gatcaagacc atagtgacca acatagtgaa accccatctc tactgaaagt 1560

acaaaaatta gctgggtgtg ttggcacatg cctgtagtcc cagctacttg agaggctgag 1620

gcaagagaat tgtttgaacc cgggaggcag aggttgcagt gtggtgagat catgccacta 1680

cactccagcc tggcgacaga gcgagacttg gtttcaaaaa aaaaaaaaaa aaaaacttca 1740

gtaagtacgt gttatttttt tcaataaaat tctattacag tatgtcatgt ttgctgtagt 1800

gctcatattt attgttgttt ttgttttagt actcacttgt ttcataatat caagattact 1860

aaaaatgggg gaaaagactt ctaatctttt tttcataata tctttgacac atattacaga 1920

agaaataaat ttcttacttt taatttaata tga 1953

<210> 2

<211> 1805

<212> DNA

<213> Homo sapiens

<400> 2

acagaaccca gaaaaacaac tcattcgctt tcatttcctc actgactata aaagaataga 60

gaaggaaggg cttcagtgac cggctgcctg gctgacttac agcagtcaga ctctgacagg 120

atcatggcta tgatggaggt ccagggggga cccagcctgg gacagacctg cgtgctgatc 180

gtgatcttca cagtgctcct gcagtctctc tgtgtggctg taacttacgt gtactttacc 240

aacgagctga agcagatgca ggacaagtac tccaaaagtg gcattgcttg tttcttaaaa 300

gaagatgaca gttattggga ccccaatgac gaagagagta tgaacagccc ctgctggcaa 360

gtcaagtggc aactccgtca gctcgttaga aagactccaa gaatgaaaag gctctgggcc 420

gcaaaataaa ctcctgggaa tcatcaagga gtgggcattc attcctgagc aacttgcact 480

tgaggaatgg tgaactggtc atccatgaaa aagggtttta ctacatctat tcccaaacat 540

actttcgatt tcaggaggaa ataaaagaaa acacaaagaa cgacaaacaa atggtccaat 600

atatttacaa atacacaagt tatcctgacc ctatattgtt gatgaaaagt gctagaaata 660

gttgttggtc taaagatgca gaatatggac tctattccat ctatcaaggg ggaatatttg 720

agcttaagga aaatgacaga atttttgttt ctgtaacaaa tgagcacttg atagacatgg 780

accatgaagc cagttttttt ggggcctttt tagttggcta actgacctgg aaagaaaaag 840

caataacctc aaagtgacta ttcagttttc aggatgatac actatgaaga tgtttcaaaa 900

aatctgacca aaacaaacaa acagaaaaca gaaaacaaaa aaacctctat gcaatctgag 960

tagagcagcc acaaccaaaa aattctacaa cacacactgt tctgaaagtg actcacttat 1020

cccaagagaa tgaaattgct gaaagatctt tcaggactct acctcatatc agtttgctag 1080

cagaaatcta gaagactgtc agcttccaaa cattaatgca atggttaaca tcttctgtct 1140

ttataatcta ctccttgtaa agactgtaga agaaagagca acaatccatc tctcaagtag 1200

tgtatcacag tagtagcctc caggtttcct taagggacaa catccttaag tcaaaagaga 1260

gaagaggcac cactaaaaga tcgcagtttg cctggtgcag tggctcacac ctgtaatccc 1320

aacattttgg gaacccaagg tgggtagatc acgagatcaa gagatcaaga ccatagtgac 1380

caacatagtg aaaccccatc tctactgaaa gtacaaaaat tagctgggtg tgttggcaca 1440

tgcctgtagt cccagctact tgagaggctg aggcaagaga attgtttgaa cccgggaggc 1500

agaggttgca gtgtggtgag atcatgccac tacactccag cctggcgaca gagcgagact 1560

tggtttcaaa aaaaaaaaaa aaaaaaactt cagtaagtac gtgttatttt tttcaataaa 1620

attctattac agtatgtcat gtttgctgta gtgctcatat ttattgttgt ttttgtttta 1680

gtactcactt gtttcataat atcaagatta ctaaaaatgg gggaaaagac ttctaatctt 1740

tttttcataa tatctttgac acatattaca gaagaaataa atttcttact tttaatttaa 1800

tatga 1805

<210> 3

<211> 1334

<212> DNA

<213> Homo sapiens

<400> 3

atttcctcac tgactataaa agaatagaga aggaagggct tcagtgaccg gctgcctggc 60

tgacttacag cagtcagact ctgacaggat catggctatg atggaggtcc aggggggacc 120

cagcctggga cagacctgcg tgctgatcgt gatcttcaca gtgctcctgc agtctctctg 180

tgtggctgta acttacgtgt actttaccaa cgagctgaag cagtttgcag aaaatgattg 240

ccagagacta atgtctgggc agcagacagg gtcattgctg ccatcttgaa gtctaccttg 300

ctgagtctac cctgctgacc tcaagcccca tcaaggactg gttgaccctg gcctagacaa 360

ccaccgtgtt tgtaacagca ccaagagcag tcaccatgga aatccacttt tcagaaccaa 420

gggcttctgg agctgaagaa caggcaccca gtgcaagagc tttcttttca gaggcacgca 480

aatgaaaata atccccacac gctaccttct gcccccaatg cccaagtgtg gttagttaga 540

gaatatagcc tcagcctatg atatgctgca ggaaactcat attttgaagt ggaaaggatg 600

ggaggaggcg ggggagacgt atcgtattaa ttatcattct tggaataacc acagcacctc 660

acgtcaaccc gccatgtgtc tagtcaccag cattggccaa gttctatagg agaaactacc 720

aaaattcatg atgcaagaaa catgtgaggg tggagagagt gactggggct tcctctctgg 780

atttctattg ttcagaaatc aatatttatg cataaaaagg tctagaaaga gaaacaccaa 840

aatgacaatg tgatctctag atggtatgat tatgggtact ttttttcctt tttatttttc 900

tatattttac aaattttcta cagggaatgt tataaaaata tccatgctat ccatgtataa 960

ttttcataca gatttaaaga acacagcatt tttatatagt cttatgagaa aacaaccata 1020

ctcaaaatta tgcacacaca cagtctgatc tcacccctgt aaacaagaga tatcatccaa 1080

aggttaagta ggaggtgaga atatagctgc tattagtggt tgttttgttt tgtttttgtg 1140

atttacttat ttagtttttg gagggttttt tttttctttt agaaaagtgt tctttacttt 1200

tccatgcttc cctgcttgcc tgtgtatcct gaatgtatcc aggctttata aactcctggg 1260

taataatgta gctacattaa cttgttaacc tcccatccac ttatacccag gaccttactc 1320

aattttccag gttc 1334

<210> 4

<211> 281

<212> PRT

<213> Homo sapiens

<400> 4

Met Ala Met Met Glu Val Gln Gly Gly Pro Ser Leu Gly Gln Thr Cys

1 5 10 15

Val Leu Ile Val Ile Phe Thr Val Leu Leu Gln Ser Leu Cys Val Ala

20 25 30

Val Thr Tyr Val Tyr Phe Thr Asn Glu Leu Lys Gln Met Gln Asp Lys

35 40 45

Tyr Ser Lys Ser Gly Ile Ala Cys Phe Leu Lys Glu Asp Asp Ser Tyr

50 55 60

Trp Asp Pro Asn Asp Glu Glu Ser Met Asn Ser Pro Cys Trp Gln Val

65 70 75 80

Lys Trp Gln Leu Arg Gln Leu Val Arg Lys Met Ile Leu Arg Thr Ser

85 90 95

Glu Glu Thr Ile Ser Thr Val Gln Glu Lys Gln Gln Asn Ile Ser Pro

100 105 110

Leu Val Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly

115 120 125

Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu

130 135 140

Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly

145 150 155 160

His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile

165 170 175

His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe

180 185 190

Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln

195 200 205

Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys

210 215 220

Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr

225 230 235 240

Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile

245 250 255

Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala

260 265 270

Ser Phe Phe Gly Ala Phe Leu Val Gly

275 280

<210> 5

<211> 101

<212> PRT

<213> Homo sapiens

<400> 5

Met Ala Met Met Glu Val Gln Gly Gly Pro Ser Leu Gly Gln Thr Cys

1 5 10 15

Val Leu Ile Val Ile Phe Thr Val Leu Leu Gln Ser Leu Cys Val Ala

20 25 30

Val Thr Tyr Val Tyr Phe Thr Asn Glu Leu Lys Gln Met Gln Asp Lys

35 40 45

Tyr Ser Lys Ser Gly Ile Ala Cys Phe Leu Lys Glu Asp Asp Ser Tyr

50 55 60

Trp Asp Pro Asn Asp Glu Glu Ser Met Asn Ser Pro Cys Trp Gln Val

65 70 75 80

Lys Trp Gln Leu Arg Gln Leu Val Arg Lys Thr Pro Arg Met Lys Arg

85 90 95

Leu Trp Ala Ala Lys

100

<210> 6

<211> 65

<212> PRT

<213> Homo sapiens

<400> 6

Met Ala Met Met Glu Val Gln Gly Gly Pro Ser Leu Gly Gln Thr Cys

1 5 10 15

Val Leu Ile Val Ile Phe Thr Val Leu Leu Gln Ser Leu Cys Val Ala

20 25 30

Val Thr Tyr Val Tyr Phe Thr Asn Glu Leu Lys Gln Phe Ala Glu Asn

35 40 45

Asp Cys Gln Arg Leu Met Ser Gly Gln Gln Thr Gly Ser Leu Leu Pro

50 55 60

Ser

65

<210> 7

<211> 223

<212> PRT

<213> Homo sapiens

<400> 7

Gln Asp His Gly Tyr Asp Gly Gly Pro Gly Gly Thr Gln Pro Gly Thr

1 5 10 15

Asp Leu Arg Ala Asp Arg Asp Leu His Ser Ala Pro Ala Val Ser Leu

20 25 30

Cys Gly Cys Asn Leu Arg Val Leu Tyr Gln Arg Ala Glu Ala Glu Lys

35 40 45

Gln Gln Asn Ile Ser Pro Leu Val Arg Glu Arg Gly Pro Gln Arg Val

50 55 60

Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser

65 70 75 80

Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp

85 90 95

Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg

100 105 110

Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser

115 120 125

Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn

130 135 140

Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp

145 150 155 160

Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp

165 170 175

Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu

180 185 190

Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile

195 200 205

Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly

210 215 220

<210> 8

<211> 178

<212> PRT

<213> Homo sapiens

<400> 8

Lys Glu Lys Gln Gln Asn Ile Ser Pro Leu Val Arg Glu Arg Gly Pro

1 5 10 15

Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr

20 25 30

Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile

35 40 45

Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu

50 55 60

His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr

65 70 75 80

Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn

85 90 95

Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser

100 105 110

Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp

115 120 125

Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile

130 135 140

Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu

145 150 155 160

His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu

165 170 175

Val Gly

<210> 9

<211> 2421

<212> DNA

<213> Homo sapiens

<400> 9

caccctcatg agccccgggt acgtttaact attgagggcc aggaaattgc cttcctcctg 60

gacactggcg cagccttctc agggttaatc tcctgtcctg gatgactgtc ttcaaggtcc 120

gttaccaccc gaggaatcct gggacagcct ataaccaggt atttctccca catcctcagt 180

tgtaattgag agactttaat cttttcacat gccttttttg ttattcctga aagtcccaca 240

cccttattaa ggagggatat attagccaag gctggagcta ttatctacat gaatatgggg 300

aaaaagttac ccatttgctg tcccctactt gaggagggaa tcaaccctga agtctgggca 360

ttggaaggac aatttggaag ggcaaaaaat gcctgcccag tccaaatcag gttaaaagat 420

cccaccactt ttccgtatca aaggcaatat cccttaaggc ctgaagctca taaaggatta 480

tagaatattg ttaaacattt aaaagctcaa ggcttagtga ggaaatgcag cagtccctgc 540

aacaccccag ttctaggagt acaaaaacca aacagtcagt ggagactagt gcaagatctt 600

agactcatta atgaggcagt aattcctcta tatccagttg tacccaaccc ctataccctg 660

ctctctcaaa taccagggga agcagaatgg ttcacggttc tggacctcaa ggatgccttc 720

ttctttattc ccctgcactc tgactcccag tttctctttg cttttgagga tcccacagac 780

cacacgtccc aacttacaca gatggtcttg ccccaagggt ttagggatag ccctcatctg 840

tttggtcagg cactggccca agatctatag gccacttctc aagtccaggc actctggtcc 900

ttcaatatgt ggatgattta cttttggcta ccagtttgga agcctcgtgc cagcaggcta 960

ctctggatct cttgaacttt ctggctaatc aagggtacaa ggtgtctagg tcgaaggccc 1020

agctttgcct acagcaggtt aaatatctaa gcctaatctt agccaaaggg accagggccc 1080

tcagcaagga atgaatacag cctatactgg cttatcctca ccctaagaca ttaaaacagt 1140

tgcggggatt ccttggaatt actggctttt gctgactatg gatctccaga tacagcgaga 1200

cagccaggcc cctctatact ctaatcaagg aaacccagag ggcaaatact catctagtcg 1260

aaagggaacc agaggcagaa acagccttca aaagcttaaa gcaggctcta gtacaagctc 1320

cagctttaag ccttcccaca ggacagaact tctctttata catcacagag agagccaaga 1380

tagctcttgg agtccttaga ctcgtgggac aaccccacaa ccagtggcat acctaagtaa 1440

ggaaattgat gtagtagcaa aaggctggcc tcactgttta agggtagttg cagcagcggc 1500

cgtcttagcg tcagaggcta tcagaataat acaaggaaag gatctcactg tctggactac 1560

tcatgatgta aatggcatac taggtgccaa aggaagttta tggctatcag acaaccgcct 1620

cttagatgcc aggcactact ccttgaggga ctggtgctta aaatatgcac gtgcgtggcc 1680

ctcaaccctg ccacttttct cccagaggat ggggaaccaa ttgagcatga ctgccaacaa 1740

attatagtcc agacttatgc cgcccgagat gatctcttag aagtcccctt aactaatcct 1800

gaccttaacc tatataccga cggaagttca tttgtggaga atgggatacg aagggcaggt 1860

tacgccatag tgatgtaacc acacttgaaa gcaagcctct tcccccaggg accagtgccc 1920

agttagcaga actagtggca cttacccgag ccttagaact gggaaaggga aaaagaataa 1980

atgtgtatac agataacaag tatgcttatc taatcctaca tgcccatgct gcaatatgga 2040

aagaatggga gttcctaacc tctgggaacc cccgctggat gccacaggga agttatggag 2100

ttattgcaca tggtgcagga acccaaagag gtgggagtct tacactacca aggccatcaa 2160

aatgggaagg agaggggaga acagcagcat aagcggctgg cagaggtagg gaaagaccag 2220

caagaaggaa agagagaaag agaaagtcag agaaagagac agagagagga agagacagag 2280

agacagaacg ttaaagaggg tgtcagaaac agagacaaac aaaaggagtc agaaagaagg 2340

acagacacag aaagtcaaag agagagttaa aaagagagga agagacaaag aagtcgaaga 2400

gagaaagaga gagatggaag t 2421

<210> 10

<211> 2421

<212> DNA

<213> Homo sapiens

<400> 10

ctttgcagat aaatatggca cactagcccc acgttttctg agacattcct caattgctta 60

gacatattct gagcctacag cagaggaacc tccagtctca gcaccatgaa tcaaactgcc 120

attctgattt gctgccttat ctttctgact ctaagtggca ttcaaggtaa ggaacatcaa 180

aggatactta atttgtaaaa tgagaaatag gaataggtat aaattctaaa aatacagaaa 240

taatgtattt gtaaaagttt cactgcatgc ttataaataa gagggaaata aatagagatt 300

ccctcagatc ataaaactta tatgaattga agtgagagaa acaaatagaa taagagaaag 360

agaaggaaaa agggaaggag gacagaagag atggggaaga gggaggatag agagagaaaa 420

tgtgagggaa tgcggacaga gatgagatac agatacttcc ttacctaact aagctcaatg 480

aaccacatga actgtgctta agggtttgac tttataatca acaagctgca attcttttct 540

tccagataat caactcttta atcatttaca gttgtgttat gatgtgatcc attcctcctc 600

agattaagtg actatttgct gatatgggga tataggttct gctaaatacc accagtctac 660

attaaatgcc taaaatgaac actgtgctaa ccttctctgc tgttcctctt ttcctacagg 720

agtacctctc tctagaactg tacgctgtac ctgcatcagc attagtaatc aacctgttaa 780

tccaaggtct ttagaaaaac ttgaaattat tcctgcaagc caattttgtc cacgtgttga 840

gatcatgtga gtgaaatccc atctgattat cacttccctg gttgtaatta tatactgtat 900

taaatatgta atgataataa aaaaagatca gtaaagggtt tgtgatgatt ctaaaactaa 960

tgtacagcaa acaaaaacat gcagagtgaa acttaaatgt ctgacttcag aactgcgtat 1020

gccatctgtt ttattgaccc aacacagttt taaatatttt catccctatt tatttctaca 1080

gtgctacaat gaaaaagaag ggtgagaaga gatgtctgaa tccagaatcg aaggccatca 1140

agaatttact gaaagcagtt agcaaggaaa ggtaggtttg ctgttgcctg cagaagaatt 1200

gctctttagg aaacggcaat cttgggagtc agaaatactt gcattgtggt ttgctgtgca 1260

atcgctggtt taaaagtatg ttaccaccac gccctcccct acctccattt atttaaatgc 1320

tgaggcacca tcttgtgtga taagtatcag aagttaccct gattaccagt caaccttgaa 1380

gtacagctat aactatctaa gcaaaactga caacattttc cccaagtctt tcatggttga 1440

aaaaagcaac ccctataatc cataatgaat gcatagcagc aggaaagctc agttatctat 1500

tctatgaact cggtactttc caaacacaac ccaatctgaa gccagagtca gactatcaca 1560

cttttatatc ccctttctct tcttacaggt ctaaaagatc tccttaaaac cagaggggag 1620

caaaatcgat gcagtgcttc caaggatgga ccacacagag gctgcctctc ccatcacttc 1680

cctacatgga gtatatgtca agccataatt gttcttagtt tgcagttaca ctaaaaggtg 1740

accaatgatg gtcaccaaat cagctgctac tactcctgta ggaaggttaa tgttcatcat 1800

cctaagctat tcagtaataa ctctaccctg gcactataat gtaagctcta ctgaggtgct 1860

atgttcttag tggatgttct gaccctgctt caaatatttc cctcaccttt cccatcttcc 1920

aagggtacta aggaatcttt ctgctttggg gtttatcaga attctcagaa tctcaaataa 1980

ctaaaaggta tgcaatcaaa tctgcttttt aaagaatgct ctttacttca tggacttcca 2040

ctgccatcct cccaaggggc ccaaattctt tcagtggcta cctacataca attccaaaca 2100

catacaggaa ggtagaaata tctgaaaatg tatgtgtaag tattcttatt taatgaaaga 2160

ctgtacaaag tagaagtctt agatgtatat atttcctata ttgttttcag tgtacatgga 2220

ataacatgta attaagtact atgtatcaat gagtaacagg aaaattttaa aaatacagat 2280

agatatatgc tctgcatgtt acataagata aatgtgctga atggttttca aaataaaaat 2340

gaggtactct cctggaaata ttaagaaaga ctatctaaat gttgaaagat caaaaggtta 2400

ataaagtaat tataactaag a 2421

<210> 11

<211> 2421

<212> DNA

<213> Homo sapiens

<400> 11

agatgacttt tttctattta tatttaataa gatgatgaac ccttcttgca ttcccgaaat 60

aaacctcaac tgttacagtg ttttattctt ttaatatgta cgaagtacat gttaagcaag 120

ttatttccta agcagcccca caaactgggc actactacca tcctgctctg cccctccctc 180

actctacttc agccacttca gccacaatgg cctctcctca ctgcccctct gatgcaccaa 240

gcttgttctc acctcaggaa tgtgcaacac ctgccagact tgctgttccc cggagcctcc 300

atccccagat atcctcatat atcatcctcc tcttcatttg tgtctctgct tacatatgac 360

ctatttacag aagcctttcc tgtctacccc ccatgaaata gaaatcgcat tccaatcttg 420

tctctacccc aatgctgttt cattttgtct gtagcaattg tcatcatctc atatatattc 480

acatgtggaa aatacacaaa atgtttaact tcttttaatt tacattccat ttccccatga 540

attgaagctc catgacagcg gagatttttc tctgctttcc ctgttgctca cttcccagca 600

ccaagagcag gcctggcaca tgggaagtac ttactattta ttgaatggat gaatgaacaa 660

atgaatgaat ggatacttat tttacacata agaaaactga agcttataga aattaagtaa 720

ctaaaatcac acagaagcac agctgaaact aaaacctacg tctaactttc aattcctgac 780

ccttaaccat taaaacaaat gacaggtgac tttaggccac tgaaaatgct catataatct 840

tatgaattct aaagcacaag ttaatcacac cattgattga aagtctgagg aatactgtat 900

agacaagccc ctgtacaagg taagcaaaag aatcagagga tggcctccaa agaattccct 960

ggacattatg ggaattacat tgttagcctt cctactgata cccataagcc tcacagcaag 1020

catcatgaag ctgtgacctt catctgcaca tgcccttgta tacccaaaag ataaaactgg 1080

atgcttcagg gccgaatggc caataaacac gtgtttatta ctggcatggg cagacacaca 1140

tactgaaagt accatttccc agcggactag ccatattatg atcagtacag acactaaaga 1200

tttagctttg aaaaaactat ttgctcttcc aaagctgaag aatcttctgt gatttcaaca 1260

ggcaagttac agtcaggtat tcttaatgtt cttttcctcc tctctcactg ggatactttc 1320

tttccttcag acaacgtcaa gcgaaaaaca aaatttcaca aatctccatt tctgacacta 1380

aacagtacag tatctttatt ttttttataa tttaatcaaa ccctgtattt tagaactgtg 1440

gggctgatcc aacattgcaa tgtgtcacat ttaattccat caatgtaaag cataatgagc 1500

aaagattaag gtagtgaggc ataactaaat gttttgaacc tgtgaatttc aaaagcaagg 1560

cccatttgtg ttattttcta aatagtaaat aaaatcattt tccaacattt cactatcaaa 1620

ttacagtaat ttttccacca gtacacactt gaggaaagcc acaaaaagac ttttccaaca 1680

gttcattctg ttattgctca taaccttcta aatacttctc ctcattggct tctattcaaa 1740

ggtaaatgga aagcagtaaa atttatggaa aatatattca actgcttaaa atacatcaac 1800

caaaaaaaag attttagagc tgtattatga gttgtgaaat tgcattgcct tcacttacct 1860

ttcagtttca ctggtaggta acaaaactga cagactggtc aagttccaaa acatccccta 1920

tatagagcct gactcttcca tctcaaattc tcaccttggt caaggccaga gtaaacacct 1980

gtccttcaca tttttacaca acatcacttt gtatgctaca aatataagct ttcataccag 2040

ggaggaagca aattccagga cactggaaac atttctgctc tcttaaacca gtctgttgat 2100

tgttcccttg actttctcag ctgtcaggat agtgaaagga ggaaaactgc aaaactgtaa 2160

agtataacct gataagtttg ccctttaagc ttttcacaca gagagaggta aaataaaact 2220

caagtctaag gtttaaaatt gagctatgaa tattatattc tagcactaga caaaaatgtt 2280

gcaagatttt aataaaataa gattattaaa atcaattttt acatttcatg ggccaaggag 2340

agacatcaaa gaatgtttaa ctaacatttt aaagatacta tactttataa agttaagaag 2400

aaaaatgaca actgcaccag t 2421

<210> 12

<211> 1227

<212> DNA

<213> Homo sapiens

<400> 12

ctttgcagat aaatatggca cactagcccc acgttttctg agacattcct caattgctta 60

gacatattct gagcctacag cagaggaacc tccagtctca gcaccatgaa tcaaactgcc 120

attctgattt gctgccttat ctttctgact ctaagtggca ttcaaggagt acctctctct 180

agaactgtac gctgtacctg catcagcatt agtaatcaac ctgttaatcc aaggtcttta 240

gaaaaacttg aaattattcc tgcaagccaa ttttgtccac gtgttgagat cattgctaca 300

atgaaaaaga agggtgagaa gagatgtctg aatccagaat cgaaggccat caagaattta 360

ctgaaagcag ttagcaagga aaggtctaaa agatctcctt aaaaccagag gggagcaaaa 420

tcgatgcagt gcttccaagg atggaccaca cagaggctgc ctctcccatc acttccctac 480

atggagtata tgtcaagcca taattgttct tagtttgcag ttacactaaa aggtgaccaa 540

tgatggtcac caaatcagct gctactactc ctgtaggaag gttaatgttc atcatcctaa 600

gctattcagt aataactcta ccctggcact ataatgtaag ctctactgag gtgctatgtt 660

cttagtggat gttctgaccc tgcttcaaat atttccctca cctttcccat cttccaaggg 720

tactaaggaa tctttctgct ttggggttta tcagaattct cagaatctca aataactaaa 780

aggtatgcaa tcaaatctgc tttttaaaga atgctcttta cttcatggac ttccactgcc 840

atcctcccaa ggggcccaaa ttctttcagt ggctacctac atacaattcc aaacacatac 900

aggaaggtag aaatatctga aaatgtatgt gtaagtattc ttatttaatg aaagactgta 960

caaagtagaa gtcttagatg tatatatttc ctatattgtt ttcagtgtac atggaataac 1020

atgtaattaa gtactatgta tcaatgagta acaggaaaat tttaaaaata cagatagata 1080

tatgctctgc atgttacata agataaatgt gctgaatggt tttcaaaata aaaatgaggt 1140

actctcctgg aaatattaag aaagactatc taaatgttga aagatcaaaa ggttaataaa 1200

gtaattataa ctaagaaaaa aaaaaaa 1227

<210> 13

<211> 98

<212> PRT

<213> Homo sapiens

<400> 13

Met Asn Gln Thr Ala Ile Leu Ile Cys Cys Leu Ile Phe Leu Thr Leu

1 5 10 15

Ser Gly Ile Gln Gly Val Pro Leu Ser Arg Thr Val Arg Cys Thr Cys

20 25 30

Ile Ser Ile Ser Asn Gln Pro Val Asn Pro Arg Ser Leu Glu Lys Leu

35 40 45

Glu Ile Ile Pro Ala Ser Gln Phe Cys Pro Arg Val Glu Ile Ile Ala

50 55 60

Thr Met Lys Lys Lys Gly Glu Lys Arg Cys Leu Asn Pro Glu Ser Lys

65 70 75 80

Ala Ile Lys Asn Leu Leu Lys Ala Val Ser Lys Glu Arg Ser Lys Arg

85 90 95

Ser Pro

<210> 14

<211> 2301

<212> DNA

<213> Homo sapiens

<400> 14

aaggcaagag atctaggact tctagcccct gaactttcag ccgaatacat cttttccaaa 60

ggagtgaatt caggcccttg tatcactggc agcaggacgt gaccatggag aagctgttgt 120

gtttcttggt cttgaccagc ctctctcatg cttttggcca gacaggtaag ggccacccca 180

ggctatggga gagatttgat ctgaggtatg ggggtggggt ctaagactgc atgaacagtc 240

tcaaaaaaaa aaaaaaaaga ctgtatgaac agaacagtgg agcatccttc atggtgtgtg 300

tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tggtgtgtaa ctggagaagg ggtcagtctg 360

tttctcaatc ttaaattcta tacgtaagtg aggggataga tctgtgtgat ctgagaaacc 420

tctcacattt gcttgttttt ctggctcaca gacatgtcga ggaaggcttt tgtgtttccc 480

aaagagtcgg atacttccta tgtatccctc aaagcaccgt taacgaagcc tctcaaagcc 540

ttcactgtgt gcctccactt ctacacggaa ctgtcctcga cccgtgggta cagtattttc 600

tcgtatgcca ccaagagaca agacaatgag attctcatat tttggtctaa ggatatagga 660

tacagtttta cagtgggtgg gtctgaaata ttattcgagg ttcctgaagt cacagtagct 720

ccagtacaca tttgtacaag ctgggagtcc gcctcaggga tcgtggagtt ctgggtagat 780

gggaagccca gggtgaggaa gagtctgaag aagggataca ctgtgggggc agaagcaagc 840

atcatcttgg ggcaggagca ggattccttc ggtgggaact ttgaaggaag ccagtccctg 900

gtgggagaca ttggaaatgt gaacatgtgg gactttgtgc tgtcaccaga tgagattaac 960

accatctatc ttggcgggcc cttcagtcct aatgtcctga actggcgggc actgaagtat 1020

gaagtgcaag gcgaagtgtt caccaaaccc cagctgtggc cctgaggccc agctgtgggt 1080

cctgaaggta cctcccggtt ttttacaccg catgggcccc acgtctctgt ctctggtacc 1140

tcccgctttt ttacactgca tggttcccac gtctctgtct ctgggccttt gttcccctat 1200

atgcattgca ggcctgctcc accctcctca gcgcctgaga atggaggtaa agtgtctggt 1260

ctgggagctc gttaactatg ctgggaaacg gtccaaaaga atcagaattt gaggtgtttt 1320

gttttcattt ttatttcaag ttggacagat cttggagata atttcttacc tcacatagat 1380

gagaaaacta acacccagaa aggagaaatg atgttataaa aaactcataa ggcaagagct 1440

gagaaggaag cgctgatctt ctatttaatt ccccacccat gacccccaga aagcaggagg 1500

gcattgccca cattcacagg gctcttcagt ctcagaatca ggacactggc caggtgtctg 1560

gtttgggtcc agagtgctca tcatcatgtc atagaactgc tgggcccagg tctcctgaaa 1620

tgggaagccc agcaatacca cgcagtccct ccactttctc aaagcacact ggaaaggcca 1680

ttagaattgc cccagcagag cagatctgct ttttttccag agcaaaatga agcactaggt 1740

ataaatatgt tgttactgcc aagaacttaa atgactggtt tttgtttgct tgcagtgctt 1800

tcttaatttt atggctcttc tgggaaactc ctcccctttt ccacacgaac cttgtggggc 1860

tgtgaattct ttcttcatcc ccgcattccc aatataccca ggccacaaga gtggacgtga 1920

accacagggt gtcctgtcag aggagcccat ctcccatctc cccagctccc tatctggagg 1980

atagttggat agttacgtgt tcctagcagg accaactaca gtcttcccaa ggattgagtt 2040

atggactttg ggagtgagac atcttcttgc tgctggattt ccaagctgag aggacgtgaa 2100

cctgggacca ccagtagcca tcttgtttgc cacatggaga gagactgtga ggacagaagc 2160

caaactggaa gtggaggagc caagggattg acaaacaaca gagccttgac cacgtggagt 2220

ctctgaatca gccttgtctg gaaccagatc tacacctgga ctgcccaggt ctataagcca 2280

ataaagcccc tgtttacttg a 2301

<210> 15

<211> 2301

<212> DNA

<213> Homo sapiens

<400> 15

aggaattgaa ctcagctctg ccccaagcgg acctaataga catctacaga actctccacc 60

ccaaatcaac agaatataca tttttttcag caccacacca cacctattcc aaaattgatc 120

acatagttgg cagtaaagct ctcctcagca aatgtaaagg aacagaaatt ataacaaact 180

atctctcaga ccacagtgca atcaaattag aactcagaat taagaatctc actcaaaacc 240

gcacaactac atggaaactg aacaacctgc ttctgaatga ctactgggta cataatgaaa 300

tgaaggcaga aataaagatg ttctttgaaa tgaacaagaa caaacacaca acataccaga 360

atctctggga cgcattcaaa gcagtgtgta gagggaaatt tatagcacta aatgcccaca 420

agagaaagca ggaaacatcc aaaattgaca tcctaacatc acagttaaaa gaactagaaa 480

agcaagagca aacacattca aaagctagca gaaggcaaga gataactaaa atcagagcag 540

aactgaagga aatagagaca caaaaaccct tcaaaaaatt aatgaatcca ggagctggtt 600

ttttgaaagg atcaacaaaa tagatagacc actagcaaga ctaataaaga aaaaaagaga 660

gaagaatcaa atagacacaa taaaaaaatg ataaagggga tatcaccacc gatcccacgg 720

aaatacaaac taccatcaga gaatactaca aacacctcta cgcaaataaa ctagaaaatc 780

aagaagaaat ggataaattc ctcgacacat acactctccc aagactaaac caggaagaag 840

ttgaatctct gaatagacca ataacaggat atgaaattgt ggcaataatc aataccttac 900

caacaaaaaa gagtccagga ccagatggat tcacagccga attctaccag aggtacaagg 960

aggaactggt accattcctt ctgaaactat tccaatcaat agaaaaagag ggaatcctcc 1020

ctaactcatt ttatgaggcc agcatcattc tgataccaaa gccgggcaga gacacaacca 1080

aaaaagagaa ttttagacca atcaatatcc ttgatgaaca ttgatgcaaa aatcctcaat 1140

aaaatactgc caaaccaaat ccagcagcac atcaaaaagc ttatccacca tgatcaagtg 1200

ggcttcatcc ctgggatgca aggctggttc aatatacgca aatcaataaa tgtaatccag 1260

catataaaca gagccaaaga caaaaaccac atgattatct caatagatgc agaaaagacc 1320

tttgacaaaa ttcaacaacc cttcatgctc aaaactctca ataaattagg tattgatggg 1380

acgtatttca aaataataag agctatctat gacaaaccca cagccaatat catactgaat 1440

gggcaaaaac tggaagtatt cactttgaaa actggcacaa gacagggatg ccctctctca 1500

ccactcctat tcaacatagt gttggaagtt ctggccaggg caattaggca ggagaaggaa 1560

ataaagggta ttcaattagg aaaagaggaa gtcaaattgt ccctgtttgc agacgacatg 1620

attgtatatc tagaaaaccc cattgtctca gcccaaaatc tccttaagca gataagcaac 1680

ttcagcaaaa tctcaggata caaaatcaat gtacaaaaat cacaagcatt cttatacacc 1740

aacaacagac aaacagagag ccaaatcatg agtgaaatcc cattcacaat tgctttaaag 1800

agaataaaat acctaggaat ccaacttaca agggatgtga aggacctctt caaggagaac 1860

tacaaaccac tgctcaatga aataaaagag gataaaaaca aatggaagaa cattccatgc 1920

tcatgggtag gaagaatcaa tatcatgaaa atggccatac tgcccaaggt aatttacaga 1980

ttcaatgcca tccccatcaa gctaccaatg cctttcttca cagaattgga aaaaactatt 2040

tttagttcat atggaaccaa aaaagagccc gcattgccaa gtcaatccta agccaaaaga 2100

acaaagctgg aggcatcaca ctacctgact tcaaactata ctacaaggct acagtaacca 2160

aaacagcatg gtactggaac caaaacagag atatagatca atggaacaga acagagccct 2220

caaaattaat gccacatatc tacaactatc tgatctttga caaacctgag aaaaaccagc 2280

aatggggaaa ggattcccca t 2301

<210> 16

<211> 2024

<212> DNA

<213> Homo sapiens

<400> 16

aaggcaagag atctaggact tctagcccct gaactttcag ccgaatacat cttttccaaa 60

ggagtgaatt caggcccttg tatcactggc agcaggacgt gaccatggag aagctgttgt 120

gtttcttggt cttgaccagc ctctctcatg cttttggcca gacagacatg tcgaggaagg 180

cttttgtgtt tcccaaagag tcggatactt cctatgtatc cctcaaagca ccgttaacga 240

agcctctcaa agccttcact gtgtgcctcc acttctacac ggaactgtcc tcgacccgtg 300

ggtacagtat tttctcgtat gccaccaaga gacaagacaa tgagattctc atattttggt 360

ctaaggatat aggatacagt tttacagtgg gtgggtctga aatattattc gaggttcctg 420

aagtcacagt agctccagta cacatttgta caagctggga gtccgcctca gggatcgtgg 480

agttctgggt agatgggaag cccagggtga ggaagagtct gaagaaggga tacactgtgg 540

gggcagaagc aagcatcatc ttggggcagg agcaggattc cttcggtggg aactttgaag 600

gaagccagtc cctggtggga gacattggaa atgtgaacat gtgggacttt gtgctgtcac 660

cagatgagat taacaccatc tatcttggcg ggcccttcag tcctaatgtc ctgaactggc 720

gggcactgaa gtatgaagtg caaggcgaag tgttcaccaa accccagctg tggccctgag 780

gcccagctgt gggtcctgaa ggtacctccc ggttttttac accgcatggg ccccacgtct 840

ctgtctctgg tacctcccgc ttttttacac tgcatggttc ccacgtctct gtctctgggc 900

ctttgttccc ctatatgcat tgcaggcctg ctccaccctc ctcagcgcct gagaatggag 960

gtaaagtgtc tggtctggga gctcgttaac tatgctggga aacggtccaa aagaatcaga 1020

atttgaggtg ttttgttttc atttttattt caagttggac agatcttgga gataatttct 1080

tacctcacat agatgagaaa actaacaccc agaaaggaga aatgatgtta taaaaaactc 1140

ataaggcaag agctgagaag gaagcgctga tcttctattt aattccccac ccatgacccc 1200

cagaaagcag gagggcattg cccacattca cagggctctt cagtctcaga atcaggacac 1260

tggccaggtg tctggtttgg gtccagagtg ctcatcatca tgtcatagaa ctgctgggcc 1320

caggtctcct gaaatgggaa gcccagcaat accacgcagt ccctccactt tctcaaagca 1380

cactggaaag gccattagaa ttgccccagc agagcagatc tgcttttttt ccagagcaaa 1440

atgaagcact aggtataaat atgttgttac tgccaagaac ttaaatgact ggtttttgtt 1500

tgcttgcagt gctttcttaa ttttatggct cttctgggaa actcctcccc ttttccacac 1560

gaaccttgtg gggctgtgaa ttctttcttc atccccgcat tcccaatata cccaggccac 1620

aagagtggac gtgaaccaca gggtgtcctg tcagaggagc ccatctccca tctccccagc 1680

tccctatctg gaggatagtt ggatagttac gtgttcctag caggaccaac tacagtcttc 1740

ccaaggattg agttatggac tttgggagtg agacatcttc ttgctgctgg atttccaagc 1800

tgagaggacg tgaacctggg accaccagta gccatcttgt ttgccacatg gagagagact 1860

gtgaggacag aagccaaact ggaagtggag gagccaaggg attgacaaac aacagagcct 1920

tgaccacgtg gagtctctga atcagccttg tctggaacca gatctacacc tggactgccc 1980

aggtctataa gccaataaag cccctgttta cttgaaaaaa aaaa 2024

<210> 17

<211> 224

<212> PRT

<213> Homo sapiens

<400> 17

Met Glu Lys Leu Leu Cys Phe Leu Val Leu Thr Ser Leu Ser His Ala

1 5 10 15

Phe Gly Gln Thr Asp Met Ser Arg Lys Ala Phe Val Phe Pro Lys Glu

20 25 30

Ser Asp Thr Ser Tyr Val Ser Leu Lys Ala Pro Leu Thr Lys Pro Leu

35 40 45

Lys Ala Phe Thr Val Cys Leu His Phe Tyr Thr Glu Leu Ser Ser Thr

50 55 60

Arg Gly Tyr Ser Ile Phe Ser Tyr Ala Thr Lys Arg Gln Asp Asn Glu

65 70 75 80

Ile Leu Ile Phe Trp Ser Lys Asp Ile Gly Tyr Ser Phe Thr Val Gly

85 90 95

Gly Ser Glu Ile Leu Phe Glu Val Pro Glu Val Thr Val Ala Pro Val

100 105 110

His Ile Cys Thr Ser Trp Glu Ser Ala Ser Gly Ile Val Glu Phe Trp

115 120 125

Val Asp Gly Lys Pro Arg Val Arg Lys Ser Leu Lys Lys Gly Tyr Thr

130 135 140

Val Gly Ala Glu Ala Ser Ile Ile Leu Gly Gln Glu Gln Asp Ser Phe

145 150 155 160

Gly Gly Asn Phe Glu Gly Ser Gln Ser Leu Val Gly Asp Ile Gly Asn

165 170 175

Val Asn Met Trp Asp Phe Val Leu Ser Pro Asp Glu Ile Asn Thr Ile

180 185 190

Tyr Leu Gly Gly Pro Phe Ser Pro Asn Val Leu Asn Trp Arg Ala Leu

195 200 205

Lys Tyr Glu Val Gln Gly Glu Val Phe Thr Lys Pro Gln Leu Trp Pro

210 215 220

<210> 18

<211> 26803

<212> DNA

<213> Homo sapiens

<400> 18

cttgctctgt cacccaggct ggagtgcagt gctgtgatca tggttcactg cagccttgaa 60

ctcctgggct ctggcaatcc tcctgcctga gccttctgag tagctgagac tatagatatg 120

ggccaccaca cctggctaat ttttaatttt ttttagtaga gatgaagtct tgctatgttg 180

accaggcttg tgggagttca gtcaggctgg tggaaaaaat tttaaagata gttataagaa 240

atagacacaa accttcttgt aaggctggag agggtttaca ttgcttcagt aacagatttg 300

gctgaaagca gcctaatcct ctctaccttt agctgatagc aaaaatgaaa ataacaaggg 360

aatgtgagga agtttatcta aatagcttgc ttactcatgt ggtcctaaaa ccaaactttg 420

atcaacctca ggtgcataat tgctctctac tcagggggtg agcaatgtta attaccctct 480

agtggtgttt actcgagacc tttgtcattt aatctgtatt aaataaatgt gaactttgct 540

agcttattga ggtgatgctc cagatgcaga gcagagcccc ttagccagac tgacaggcaa 600

aatatctgtg tcagtgtatg tctctcatcc atcactggtt cagggtctgc gggctggatt 660

cctgcacagg ctggtcttga actcctgggc tcaagcaatc ctcccgcctg agccttctga 720

gtagctgaga ctacagatat gggccaccac acctggctat ttttaacatt ttttagtaga 780

gatgaagtct tgctgtgttg cccaggctgg tcttaaactc ctgggctcaa gagctcctcc 840

tgccttggcc tcccaaagtg ctgggagtac aggcatgagt catggtgccc agacggacat 900

ttttttaaaa ataaaggaat actcctgaaa cgctgaagtc ttctttgtac ccctctgtga 960

taacatgaat agcctcttaa tgacaccaag gagcaagaca agttagtccc aaagtagctc 1020

acatagatga tgataaagga atgaggggtg ggtgtgatct atgcaaaaaa cccttactct 1080

ttaatgggtt gctgtttcta acataattgc aacagtaccc tacattgcta taatgcatta 1140

tagttttcaa agtgcttttg tggcctccat aatagagagg ttgtgaggta agcttcaacc 1200

acggctgccc tactacccaa gagtggacac acaatgatga ataggtcaat ttctgcctct 1260

tagtttctta gctagggagg ggcacttact ggaacagcac agaaaacaga gtctttggcc 1320

cagttggaga atctttatca ggttatgcta cttcaagctt tcctcctgtt aaatgtgaga 1380

ggaataaatc cctgttcctt ggatcagtgt gactctgaaa cagctggagg agagacagct 1440

ttaggcaggt tgaaacagag agctccagca tatgtacttt tttttttttt ttgagatgga 1500

gtctcgctct gtctcccagg ctggagtgca gtggctcgat cttggctcac tgcaagctct 1560

gcctcccagg ttcatgccat tctcccgcct cagcctccct agtagctggg actacaggct 1620

cccgccacca cgcccggcta atttttttgt atttttagta gagacagggt ttcaccatgt 1680

tggccaggcc agtcttgaac tcctgacctg aggtgatcca cctgcctcag tctcccaaag 1740

tgctgggatt acaggcgtga gccactgaac ttggccaagt gcactacttt taaaagttaa 1800

agtattatgc agccatgagg gaatattgtg caagaagaaa gcttttacaa gaaaaacttg 1860

aaacattggt atttttgcct cctttttaac aactagagtc gttttgggag ttgtttcttg 1920

tcgaagaaac aacccatgtt tattttccca gtatggcagg accatgtagg aaagcaaaat 1980

tacccctcag gagaggaaat tctctgacac tctataaggc tccataaccc tcctctgaac 2040

tgtggccaac aagattgggt agcacttttt aaggtagttt aagaaaaata ggctgtgcat 2100

ggtggtttat gcctgtaatc ccagcacttt gggaggccga ggtgagtgga tcacctgagg 2160

tcaggagttt gagaccagcc tgaccaatat ggtgaaaccc catctctact gaaaatacaa 2220

aaattagccg ggtgtggtgg cgggcacctg tagtcccagc tactcgggag gctgaggcag 2280

gagaattgct tgaacctggg aggcggaggt tgcagtgagc cgagactgtg ccactgcact 2340

ccagcctggg tgacagagca ggactccatc tcaaaaaaaa aaaaaaaaaa aagaaagaaa 2400

gaaaaatata tagtgagccc aataaagctg tataatctaa atcaaacatg acttgcatgc 2460

ctggagactt tgcactagaa aaatatttct acctaaaaaa tcaaatttta ttttctttct 2520

cacaaatatt caatctgctt tcatctcagt tcttcctacc ttgtcaaacc tctccccaca 2580

tttcctattc tttttctctc cagcctgata tctctcatta tactgcttaa gagaaatgtt 2640

atgttactat tcttttctcc cagaactgtt tctctggttc tttaaggtgt ctgagtacac 2700

actgtgcctt cttcctttta gccctctctt ctccttgttc cctgagcctt acctttatga 2760

ccttagaact tcaagttccc actacaattt taaatataga ctattttgct tttcctccta 2820

ctagggagct taaattgcct ctaattacac tgttttcccg agtccttcct ctcctttgca 2880

atttagatat agcacagaag cacattttgc ttgactgtcc tctgaactgt catgctgttt 2940

tgatgtggtt ctattgtcca agagtcttgg ttaaataata gcccagcatc ccacctgtgt 3000

ttaaaagaac tgcttcacag gcaaatcaaa aagcccatgg atccgaagtc acaatgggcg 3060

ttgctattca aacagcacca gattgctatt caacgcttgg ttgaaaaata aatttcagtt 3120

tcattcacct aatatatttc cttctatttt gtaggatggt atgctcttac ttcaatttgg 3180

acttgttcac aattgaacgt taacatagcc ttatagatta gcctgttttc attggtccag 3240

agtattctcc aaataaagca gggtctgtgc attttaagca actcccctga acaatttcat 3300

gggcattctc aaatttgaga actacctgaa aagctgtgtt ggagaaaaga acaaccaatg 3360

aatgtggcag gacagaatat tgaacattaa cttccctttt cctcttctcc catctgttct 3420

cttccattat ccctacccgt ccgctcagtc tcgttattca ggcaacagtt attttgccat 3480

tatttcctca agaaaggaac aaaagtaaac acaattgctt tctgattttt tttttttttt 3540

tgcattttaa aatggacttt gaaaccataa gcaaagaggt gtttaagagt ctttccaaag 3600

ccaaaaatga aggttttgaa atttcaaagt cactgccttg aagagactcg aggtttggag 3660

tgtgtacagt atgtcggagc tggacttttc tccttcctga gactagataa cggtctgaat 3720

ccaagacagt tttcatgatt tcagaggaag tggtcaagtg gtctgtgagg tagaccttct 3780

gcttaagagc agtcaggagg ccgggtgccg tggctcacgc ctgtaatccc agcactttgg 3840

gagaccgagg tgggcggatc acctgaggtc aggagttcaa gacaagcctg accaacatgc 3900

agaaaccctg tctctactaa aaatacaaaa aattggccgg gcacggtggc acatgcactc 3960

cagcctgggc aacaatagtg aaactccatc tcaaaaaaaa aacaaaaaaa agagaagaaa 4020

agaaaagaaa aggagcagtc aggatgtgtg cctccaaagc tgaggtagac aaaaagatac 4080

cagagttcta gaggcctgcc aggcacagca gcagcagcag aaggaaggtg tgggcgagaa 4140

cagggcagcc aggcgtgtgc cacctcccag acacaattat tgggaatgga gggcaagtgg 4200

tgatgggaga aaatcttgac ttaattgatg tcaagattaa agaaatgcca cctggtggca 4260

tttaagttca cacataggta aagaaagtta tgcatttact gtgaaagtca tcccactatt 4320

tagtagaaac aggagatctg gattctggtc aagagtctct tttgccaact gtggcaccac 4380

tgagcagcgg cacagctttt gtgaatcctg ggttcttcat tattaaaatg gggacattag 4440

cgttgggttg agtataagaa atggacattt ttgcaggtca aaaatggttg aatatttgca 4500

ttttcatatg attcaaccga atacttactt cacaggcata aggaaaaaaa tagaataaca 4560

tactaacaac tgtccctgga gtaagtactt aacaaataca tgatttataa agaagatatg 4620

tgaaagatat ttgtaagtac atgatttata gaaagatatg aaagtatgta aacccttgtg 4680

gtctaatggt cacagaataa tctgagctta atatccctgc tccctaccat acagaaggca 4740

aaatgcctat taggggtttt ctttcttcac cctctccttc tttttcctcc tcctcttgac 4800

tcctcctcat cctcctcttt cttcttcccc ttattaatgt ctaaaaaggg gctgagcatg 4860

gtggctcatg cctgtaatcc tagcactctg ggaagctgcg gcaggtggat cacctgaggc 4920

caggagtttg aaaccagcct ggtcaacatg gcaaaacccc atccctacta aaaatacaaa 4980

aattacccag gtgtggtggc aggcacctgt aattccaact acccgggagg ctgaggcagg 5040

agaatcgctt aaacccggga ggcagaggtt gcagtgagcc aagattgtgc cactgttgtc 5100

catcctgggt gacagaggga gactctgtct caagataaat aataataata ataataattt 5160

ctaaaaaggt aatacatttt catagttcaa aaaccaaaag gtataaaagg aaatacagta 5220

aaaaatttcc tatcatatca ctgtctagag tactattcct tatatatttt cctgattttt 5280

gagtatttta aaatgtgagt gttggatatg agtgttggat ttaaaaagtt ttatgataat 5340

ttgtgtatat ttgtgtgtgt gtgtgtgtgt gtgtgtgtgt atagtagtcc aagactatca 5400

gtttatgaat aataagagga gacccatgga aaaccagtcc ctttgaccaa gttcactcag 5460

ataatcagca gcagggcttg gacattaatt acagttatcc aacatccttt gaggtctcac 5520

atgacaaatt acaaatatgg agtgtaaatg taacccactt tgctaggcaa aaaaagccct 5580

gtttttttaa aaaatatata tttttggctt atgggcaaca gaagccaggg agacgtacag 5640

tcaaacctca tttctcatgg ctttcatatc tgcaaattct cctactcatt aaaagttatt 5700

tataactccc gaatcaatac ccacagcact tttgtgatca ttggcagaca tgtgcagaaa 5760

agaaaaaaaa attgagttgt tgattgcaca cattcccagc tgaatttcaa caaagcaaca 5820

ctctgccttc ccacttcagc tttcttacta tatgtgtgtc ctttttctgt ttatttagta 5880

ccatgttttt cacactttcg ttctttttgg tggtgatttt gctgtttaaa atggccaaca 5940

agtgtagtgc taagtgctgc gtagggttct taagcacaag aaggctatga tgtgccttat 6000

ggagaaaata cgtgtgttgg atcagtttca ctcaagcatg agttatggcg ctattagctg 6060

tgagttcaat gttaacaaat caacaatata tgctaaagtg tctttaaaca gaaacacaca 6120

taaaacaagg ttatatgttt ggttggcaaa aatgttataa ccagaagctt gcagaaacct 6180

aaccctgtat ttcccttaag agcaatggtt cattattcac taattcaatg tttacagcaa 6240

ctttataaac tataactacc atgaataatg agaattgact atgttttaga tcataatacc 6300

tgaagtgaag ttttccatca tggtttttag ttcttagagt ccatttaagt tttttaaaaa 6360

tatgatagct atcctatcac atcccacatt cttgagatta aaaaattaat cttttatttg 6420

gtacagaaaa ggctcctgcg tgcatttttg gaggggctgg accgctgagg aagtcatggt 6480

tggctcaagt ggtttaaatg cattgctaat ttcatagcct ctgaaccact tatgaaacaa 6540

tactgatgat atgtcagtag ctatgtttgc agctccttca ggaatgctta tatcttttac 6600

tgctggtaaa gaagaaattt atagtaatag attttttttt tttttagata gagtctcact 6660

ctgtcgccta ggctggatta cagcggcttg atcacggttt actgcagcct ggatctccca 6720

ggctctccta ctgtagcctc cccagtaact agggccccca cacaggcatc accacaccca 6780

gctcattttt ttatgtttta tagagacagg gtcttactat gttttccagg ctggtctcaa 6840

acttctgggc tcaagcaatc ctcctacttt ggcctcccaa agtgctgaaa ttacaggcat 6900

gaaccactgc acctggttta tggtcatctt aagtagagac ttatgagtgc gtatcattgt 6960

atcaccaatc tgagactcaa ttttatcttt ctgttaatag acaatgcagt ttttctgtta 7020

attacaatga aaatcaaggg ttgcttagca agtttttact cataactcca agttttgtga 7080

cttatagtga gaaatgggta taattctttg tgatttgtta aaatgcagta tttcgaggag 7140

ggataacata taaaatttaa cagtttccta tcattatttt tatccttttg aaccactgta 7200

tactacagat agacaaaggc agctttggcc acttactcct cagtgtgact aagttgacca 7260

gatgttttcc agaccacagg ttctgtcaag agacagtgtg gagagaaatg ggtaggcagg 7320

tatggaaaga agagtcagaa acagatagtg agctaatctc tacaaatggc tcgttatggc 7380

ctgagctgtg ttctcctccc cgcaaaaaga tatgttggag tcgtaatccc cagtacctca 7440

gaatgtggcc ttatttggag attcgatatt tacagaggta agcaagttaa aatgagatca 7500

ctatagtggg tcctaattca atacgactgg tatccttaca aaaaagggga aatttaacca 7560

cagatacaga cacacacata gggagagtgc tagtgaaggt gaagtcagag attggaatga 7620

tgtagcagaa gcctaggaat gccaaagatt gccagcaaac caccagaagc tgggagagcc 7680

acatggaaca gattctcctt cacagtcccc tgaaagaacc aactctcctg acacctcgat 7740

ttcagacttc tagcctccag agctggggtc aatgagcttc tctcattaag ccatcatcca 7800

gtgtatggta ctttgttaca gcagtcttag caaatgcatg gttcctcact ggaaccatga 7860

atttccatgc atttatttca tttaaataat aaaacggatc ccctttgtgg cttgtagttc 7920

tgttccattt caaaaatcca gaaaaaagat ttgttcagaa gctagaaatg atgaactgga 7980

tcttgcccaa ggtcataaaa ccacaaaacc ctttacagag cacaaaagtc tgatttttca 8040

aagcttctct caaaagatgg gtcactcctt agtcatttag gccactgaca actgccctgg 8100

actctttatt tatttattta tttatttatt tatttaattt ttttgagaca gagtcttgct 8160

ttgtcgccca ggctggagtg cagtggcgtg atctgagctc actgcaagcc ctgcctcccg 8220

ggttgacgcc attctcctgc ctcagcctcc caagtagctg ggactacagg cacccgccac 8280

cacgcccggc taattttttg tattttgttt agtagagaca gggtttcacc atgttagcca 8340

ggatggtctc gaggtcctga ccttgtgatc cacccgcctt ggcctcccaa agtgctggga 8400

ttacaggcgt gagccactgc gcctggcctg gactcttaca tataataagc ttgacttatc 8460

gtacaactta taattgatgc tttcacgtca tgggaagatc aaattaatgc agagagcgac 8520

tacgtttctg gtgggagagc agcaggggtc ttgagaggaa cagcagtgtt gactgtttcg 8580

ctacctactc tgggtgctga ttacatcttt ctttcgtgca ggcaaatcca cttggagcta 8640

ttttgggctc actgtgggca tcattctttg tatactctgc tcctttcccc catagtttct 8700

ctattgatgg gggattacta aagaatgaag aaaagaacaa aatgaaagtg gcttttgaaa 8760

aattttaaat gactgtcact atgtaacata ttcattattt catgtctcca ctggacattt 8820

tggagatgtg agccttgcaa tacctacatg aatgcttcta tgattatgat tattgttttg 8880

ctcttcgcct aacaacttgc caagtattgt caacctcagt gtgtgagatg gggtccactc 8940

aaacatcagg gccgaagtca ggtagttcag ttaagtgaat ttgataccag gaactagtta 9000

caaaggagtt ggaagggctg gaaagccaaa ctggagaaga aggggaaccc cagagtaaca 9060

atagcaggaa gcctctaccg tctacctcta gaactgggga ggagctgagt taacagagtc 9120

ctggagccat tgctggggaa gaagaacccc aactgcagag gaaaagtggc cattgtgaag 9180

aaggtgatgg tggagaagtc gtctgaatca aaggggagag gatatgttgg ctcctttatc 9240

tttttatctt tcattgtcct aattccttct gggcatggtt aaatgagccc aggaaatgca 9300

gttggcagga atcagcttcc tgtgacatag acagagtaag agaaggacaa aaataatgaa 9360

tctgagagca agcaggcaaa tgaccagcac attaagccta gcacacagta tgttatacgg 9420

gatttggggt agcaaaagat gaaggcaggt cagagaagcc acaactaggg gatgggcaag 9480

gtcaatgagg tatgacgggt attgtataca ggaagagggt cataaacagg agtggagtca 9540

atacaggaga ctaacatata cacatcataa atattagtag agaagcataa aatagtctcc 9600

tggagatcag ggaaacagga aattataggt tttcaggata attcagccat atccaggaaa 9660

cacacacagt gaagtaacaa agagtcaata ggcttagagt ggtacaattc attatgcaca 9720

tgtaggaatt cattccaaat aataggctga aatgtagaca tgagaatcca aaaaagatgt 9780

tttcttagtt tttgccaata tcttagctac gttttttttg gttcaacaaa gtaagttaac 9840

agtcatatct gcttggaaat tgtatttagg ccaggtgcag tgtctcacgc ctgtaatccc 9900

agcacttggg gtggctgagg caggaggatc ccttgagccc aggagttaga ggctgcagtg 9960

agcgacaact acaccactgc attccagtct gggtgacaga acaaaaactt attaaaaaaa 10020

gaaaaaaaaa aggtcgggcg cggtggctca cgcctgtaat cccagcactt tgggaggtcg 10080

aggtgggcgg atcacgagtc aagagatgga gaccatcttg gtcaacatgg tgaaacccca 10140

tctctactaa aaatacaaaa attagctggg catggtggca tgcacctgta gtcccaccta 10200

ttcaggaggc tgaggcagga gaatcgcttg aacccgggaa gcggaggttg cagtgagctg 10260

agattgcacc actgcactcc atcctgtcga gactctgtct caaaaagaaa aaaaaggaaa 10320

agaaactatt gaaatagctg atattagttt gcttacttgt cgttactctt tttcatgatg 10380

gattataaag aaaagttata actatttgaa ttttctgctg atttgaagtc tctataaaca 10440

gtacattcct ttttggtaca cagagggcac ttatctgcaa gaaaggcaaa gaaaatggaa 10500

aagttaatga aagaggaatc atccaatcca cgaacagaat gaaaccacat acacagtgaa 10560

gaaacttgtc ttacattttc ttccttatat tacttatcat tcatggtagt gactactttg 10620

gggcttgagt aaagcttctc taatttattc catgtagcat catatgtgaa aaagacaaat 10680

agatacttta gacatgataa taacacttta ttttttattt atttgtttat tttgagacag 10740

agttttgctc ttgttgccca ggctggagtg caatggtgca atctcagctc actgcaacct 10800

ctgcctcctg ggttcaagcg actctcctga ctcagcctcc caagtagctg ggattacagg 10860

cacgcatcac cacgcccagc taattttttg taattttagt agagacaggg tttctccgtg 10920

ttggccgggc tggcctcaaa ctcctgacct caggtgatcc acccaccttg gtctcccgaa 10980

gtgctgggat tataggtgtg agccaccatg cctggcccat aacaccttat ttaaaaataa 11040

tctgtctgga tccatacaac ttgtctggat aactaaattg gaaattattc cttgttttaa 11100

agtaattcaa ttgaaaattt ttaaattttt ttgttaatca agcacttttt ggtggaatct 11160

aaattaacac atgtaggaga tgcctgtttc actaattaca caggcatctt gcagtaatta 11220

atgtctggga ggaaggaatg tcttttgctt actctcttct tcttcacaaa aatgtgaatt 11280

ttggaaagca ataatggaag catgtagaat tatagaaata caaatgtata taactatcac 11340

aaaaaaatga ggccaaagga ctattcagat ataattaggc tatggtagct gtaattatct 11400

aggaaattaa taaaattcat tcacctagaa attattagtg agcatcaaat atgtgtcagc 11460

actaggctag ggtctcagaa cgtacagata aatcatagtt ctggcttcag ggagttatat 11520

agattagaga taaaacctaa ctacaggggc tgggcacggt agctcatacc tgtaatccca 11580

ccactttggg aggccgaggc gggtggatcg cctgaggtca aggagtttga gaccagcctg 11640

gccaacatga taaaatcctg tcactactaa aaatacaaaa gttagccggg aggtagtatg 11700

tgcacctgta atcccagcta ctcgggaggc tgaggcagga gaatctcttg agcctgcggt 11760

ggaggttgtg gtgagctgag atcacgacac tgcactccaa tctgggcgag agagtgagac 11820

cctatctcaa aaccccaaac aaaacaaaca aaaaaaccaa acctaactac agggctatga 11880

gagatgacta ctggcaagga gccacaggta gaacaaaggg gatgtgtccc caggcaaagg 11940

gtagtcagca agcctgcaac ctcagggttc ccggatctga gcctctggct cttggctagg 12000

caggccccaa gcgttggcct cctgccatgg caagctccag cctggtctcc caccttgagc 12060

taacattcat atgttgtaga cacagccacg cttcctgctt acctgtcact tccagttctc 12120

gaaggcaccc ttttcaaatg aaaatccgcc ccttttcaca tcaaacagct catctggtcc 12180

tgtggattac atttctcaga aatgcctctg aacattcgcc tcctctccac ccccactgcc 12240

tctgctacag tgcaggtgct cgccatttct gatttgttct gtcacacact cgtttatcag 12300

gtctctccat ctcctgtttt gacatgctgt aaagcaattt gccactggaa aaaagggctc 12360

tctttttttt tttgagacgg agtctcgctc tgctgcccag gctggagtgc aatggcatga 12420

tctcggctca ctgcaacctc tgcctcccaa gttcaagtga ttctcctgcc tcagcctccc 12480

taaagtctgg gattacaggt gcacgccacc aagcccggct aatttttgta tttttagtag 12540

acgtggggtt tcaccatatt ggccaagctg gtctcgaact cctgacctca ggtgatccac 12600

ccgcctcggc ctcccaaagt gctgggattt caggtgtgag gcatcgtgcc cggcctctct 12660

ttccaaagta tgttattatt tttcccaaga ccctttgacg gatcctcatt tcctacacac 12720

agtggttctc aaacttggat gtactccaga attacatagg aaattcttca tttttttaga 12780

cgaggtcttg ctatgtttct caggttggtc tcaaactctt gacctcgtgt gatcctccgg 12840

ccgcagtctc ccaagtagct gagattatag gcgtgccact gagcccagct ggaaattttt 12900

ttaaaacaca gattcctctg aatcaaaatt tctagaagtg aggtctgagc aatctgtatt 12960

tttaacaagt tatccagatg gctctttact gtcagtctgg ttccagctga gggagtttta 13020

gaattacaag gcaaagtcca aacttagcac acaaagtcat tcacatcaac tcttcccctg 13080

tacacaccct atgtcatagc cagagttgta acccatttct taaacaccca gggttctttt 13140

aagtctctgt gtcattgtat gttattttct ctagaattgc ctttaacctc ctttccaccc 13200

tggaaagcat tccctaagcc atctttgaag ctttctttga tctctaactt agagtcctcc 13260

tctccttcta aagccctgtg ttaatcactt gtcatggtgt actttaattt ttacttgcct 13320

gtttctcttt acggtacttt gacttcaaag ggtggggctg caaattagtc atctccttag 13380

agtccagcct tgttcctagt tcctaactgg cacttaatat aaacgaatga atgaatggac 13440

aaatgaagag aatgctagtt atgataaaga attggccgtg tatgagacta cttctcttta 13500

tgaactaaat aattatatgc ctttcaataa aatactagta cacgtagcta gcacaagctc 13560

atcagcattt gagatgatat ggaaaccaaa ataaacaaat gctaccacaa aaacataatg 13620

actgctttcc ccagtgcagg actgatggaa tcatcaaaca ttgagattaa tgtaatgttt 13680

ggcagatgtc cagtgttttt atttttcatt tgcctttgtg ttcatttatg gactaacaat 13740

ataataaaca cacacatact cacagtacat cttttttttt tttttttttg caaagcccag 13800

ttttcttcat cgcatatctt tgttttcttc aagtatcccc ttacttaatg ttggtagtat 13860

tttttttaat gaaatataaa tccctaacca ccaagcaaga aatgagactc ttaattgcat 13920

cagtttacag tgcaatgtga gtgtaaatag tgtaaattga atttttaatg gacttttttt 13980

tttcccgttt ttgcttgcct tacattcatt atccctccct gggtaataaa catttatttt 14040

tccctttgta accactcctc cccttctgtc catgtggttc tttttagtgg agctggtggt 14100

agggatgtgg catgagattc aagcttggcc acctggagtc actgtgttgt gctccagaag 14160

gacacctgat ccaagtcagc cagtaagagt gagccccagg atttttgctt ggaccactga 14220

ggaaaagtgt actctgccct gtggctgatc aaccattagg atataagcca ttgttgtagc 14280

tgtgtgagtc aagctacctg agaatgagga caacacagtg gcaagcaaca ccaagagaga 14340

aaaagaggca gattctgatg acatttttga gcctttgcat ccagctatgc ctgaatccaa 14400

tttatcccct ggaatttaca cttacttgag ctccacccac ttgaaagaaa acatttcttt 14460

ttattcttag cctgatttga atttggcctc tctcatttac tacccaaagt gtcttgacca 14520

ctagaatatt atgccagact ttacagcatc attgaatttg ccactttcca gaagagttgt 14580

gtgaattttc aatgtagctt ttaccttcta tgagtatcta gagatatatt taagtagaag 14640

tactccacta gtttgttgtg agatcttaag tcacttaatt tctctgtacc ctagttccct 14700

catttgctag acctagggag ctataatgtt ccttctgcaa aattcttatt ttgtgaaata 14760

ttctagaatg tctaactgat acactgctag aacaactgac tgctatttaa gaagagttga 14820

ctgctattta aggatcataa ttctctaggc ataagtgctg tgacggcaca gcgtgtgcat 14880

cggggctgag gggtggggtg gagcagaaag taggaggaga aagtttgata aacttccttt 14940

tggataaatt gaaaacagtc aaataattta taatttctta tattatcatt attagcttct 15000

tctataatta ggagacttgt tccaaaatgt gagaattgtc acaagttgtc aaattcatca 15060

aaggaagaaa atggatgtct cacaaaaaag tatgctcagt ccaatttctt ctcgtcacac 15120

tggaacaaac tgaacagttt tacacagaga tgagaagcct ggacattttt caaatatgtt 15180

ttgaagagaa tggcaatgcc tgagacagaa gtaggaaaaa gcaatgaata tttaaaaatc 15240

tgagctggtg taaaactaga aatagtttta gtaagaacaa tgtgatgtgc tacactaagt 15300

gaaatgtata cattgggcca cattataatc aaaaataaga atgtactttt attcatcttt 15360

tatttaaaca ataatcaagg tggcgggcgc ggtggctcat gcctgtaatc ccagcacttt 15420

gggaggccaa ggtgggtgga tcatgaggtc aggagttcaa gaccagcctg gacaacgtgg 15480

tgaaaccccg tctctactaa aaatacaaaa attagctggg tggggtggca tatgcctgta 15540

ataccagctg ctcggggggc tgaggcagga gaatcgcttg aacttgggaa gtggaggttg 15600

cagtcagcca agattgtgcc attgcgctcc agcctgggtg acagagcaag agactctgtc 15660

tcaaaaggaa aaaagaaaaa aaaaaaatca aggtaccatt tgtaccattt cctggaattt 15720

ctccaaagtg gcaaggtcac atgtttatac attagactcc cagtttaaca cacagcagac 15780

aataactttt tttttttttt tttgagatgg agtctcgctc tgtcacccag gctggagtgc 15840

agtggcacaa tcttggctga ctgcaacctc cgcttcccga gttcaagcga ttctcctgcc 15900

tcagcctccc gagtagctgg gattacaggc atatgccacc atgcccagct aatttttgta 15960

tttttagtgg agatggggtt tcaccacatt gtccaggctg gtctcaaact cctgacctca 16020

taatccagcc acctcagcct cccgaagtgc tggtccaccc ttccttcttt tctcccttcc 16080

atccttctcc cttttattcc atttttctaa atattagacc atagtacaaa tcaaaagtca 16140

caaactgata ggctgcaatg tagatacagc tgggaaaatg ttttgtttgc agaacactgg 16200

ggaaatttaa catgaaaaac tggaagatct caatccacat ggccacatgg taatattatt 16260

aatgttgcag gggctttcca attcaacatg tcctctgcat ccctactatt tatactgcca 16320

ctcatccacc tttctgtatt actggcctat cacctataca cgtttgagtt tatattcttc 16380

tggctttact tagcaactta ccttttatat ttaacattac aacatggtat tatcaattag 16440

tattcgattc agttgcatat aaccaaaaat gccaaattat actggcttaa acactaagga 16500

tttatttttc tgtcatataa aacaagtctg gaggtgggta gtccagggct aatatgacac 16560

tccagtgtca caaggtacct gggctccttc tatttatctt tttttttttt ttttttgaga 16620

cggagtcttg ctctgtagcc caggctggag tgcagtggtg cgatctgggc tcactgcaag 16680

cttcgcctcc cgggttcaca ccattctcct gcctcagcct ccggagtagc tgggactaca 16740

ggcgcccgcc accacgcccg gctaattttt ttgttatttt taatagagac gaggtttaca 16800

ccgtgttagc caggatggtc tcgatctcct gacctcgtga tccactcatc tcggcctccc 16860

aaagtgctgg gattagaggc gtgagccacc gcgcctggcc ctatttatct tttataggac 16920

atggcttcca gtctcaagtt cagtttgtca cccataatgg ccaaagagca gtagtcacct 16980

tacctgtttc aggcaggaag ggcagagggc aagaaacaaa atggtgctcc tcctgattga 17040

gtcagcgttc tttaaagatg ttttccagat gttccaccca gccgcgtttt tttttttttg 17100

agagacaggg tcttgctctt gtcacccagg ctggagtaca gtggcatgat catggctcac 17160

tgaggcctca atctcccagg ctcaagcgat ccttccattt tagcctccca agtagctgga 17220

agtagctggg accacaggca catgccacca taccctgcta actttttcat tttgtgtaga 17280

gacaaggtgt cactgtgttc tccaggctgg tctgcagttt ccaactcctg agtgcaagtg 17340

atcctcctgc tttggcctcc caaagggctg ggattacagg tgtgagccac tgtgtctggc 17400

caagctactt ctacttatat ctcattggtc ataacttgat cacacagcca catccagcta 17460

caatggagat tgagaaatgt agtcttttgg ctgggtacac agcatctgaa taaaatccag 17520

gcattgttac taaggaagaa ggagtaagtg tcaatctctg ctccataact ctctaggtta 17580

atacacacag atggaggaga ttgctagttg cccctcaaga tccagccttg ccttctgggc 17640

taagaaagcc cctgagattt acctggccat agtggcactg ggaacaaaca atgtatttct 17700

aaatcttctg attttaaaat ctttcagaat cacgatttct ccgacatcag tatttttatg 17760

tctttagaat tcaacaaaat gaaattccta agtctaatat atgtgaatat taagttttag 17820

cagatactgc tacataactt tccagaaggg tgtggcaatt cacatctcca ccagtgatca 17880

gcatgttcat tttccataca gctctggata ttttgtctat tttaaaatat cttcttctaa 17940

tctataattt aaaaatgtaa cttagtagga atttaattgt tcatgtaacc aaatcttccc 18000

attaatggct atgggtttct tcttttactt cagaaagtcc tccccacctt cagagtatat 18060

aaacattttt ttctaaattc ccttctaatt tcttataatt tatagtttta tttttgttat 18120

ttgattcatt tattctctca acagatattt attgagcact tattatacgt caggctctct 18180

tcaaactctg gtgagagtat tttctaactg ggagagacaa ccctagttga taagaaacaa 18240

acaaaccaat aagtaaataa gacatttccc ccagataatt aatacttggt gacgggggaa 18300

gacagtgaga caggctactt tacactggca ggtcaggaaa ggcttctctg aggaggcaag 18360

tgattcagga ttaattgatg actggtggag aagtccgggg agtggacaca ggtgggaaca 18420

gcctggtggg tgtgaacagc aacaagaagg ttaatgtggc ttcatggaac agggtgaaga 18480

tgagacaagc tgaacactga ggtgggcacc agaacatgga gggctttgta ggtcccaata 18540

aggagtatgg attttattgt atactggaga tttgtcatcc atctagaatc tgtttttata 18600

tataagaaaa ggtgtatatg tttgcgcaag tgtgtgtgtg tgtgtttggg ggggcggggt 18660

gggggcagac agggcgtaac ttttctttaa attagagtca aaatttaatt aaactattca 18720

ttctttacag gcagtgaggg gattaggatc ttatcccaca gaatctcacc tcatttcaaa 18780

tgttgtacag atattatctg agatatattt tcaggccggg tgcggtggct cacgcctgta 18840

atctcagcac tttgggaagc cgaggcgggt ggatcatttg aggtcaggag ttcaagacca 18900

tcctggccaa catggtgaaa ccccatctct actaaaaata caaaaattag ccgggtgtgg 18960

tggtacacgt ctataatccc agctacttga gaggctgagg caggagaatc gcttgaatcc 19020

aggaggtgga gcttgcagtg agccgagaaa acgccactgc actccagcct gggcgacagg 19080

gcaagactct gtctcaaaaa aaaaaacgaa aaaagaaata tattttcaat gaaatcaagc 19140

atataatgac tatttttatc ccagcatctt ggcttcttca ggctgctata acaaagcatc 19200

cctagtggag catccctaat ctgaaaatcc aaaatccaaa acgttccaaa atctgaaacc 19260

ttctgaacac tgacatgaca ccacaaatgg aaaattctac atgtaaatac acgtaaatac 19320

aaactttgtt tcatgcacaa attaaaaata ttgtataaaa ttaccttcag gctatgcata 19380

taaggcatat atgaaatata aatgaatttt gtgtttaccc atgggtctca tccccaagat 19440

gtttcatttt gtatatgtgc atactcccaa atctgaaaaa atccaaaatc ttaaatatct 19500

gtagtcctaa gcattttaga taagggatat tcaatccctt atccataaac aatttattta 19560

taaacaacac aaatttaggc tttgtaaaaa atagaaattt ggccgggtgt ggtggctcac 19620

gcttgtaatc ccagcacttt gggaggccga ggcaggcaca tcacttgagc tcaggagttt 19680

gagaccagcc tggtcaacat ggtgaaacct tgtctctacc aaaaatacaa aaattagcag 19740

ggcttcgtgg catgcgcctg ttgtcccagc tactcgggag gctgaggcag gagaattgct 19800

tgaacccgga aggcagaggt tgcagtgagc caagattgag ccactgcact ccagcctggg 19860

ggacaagtga gactccacct caaaaaacaa acaatcaaac acaatataaa tttatttctc 19920

atagttctgc aagctgagaa gtccaagatc aagatgtgag cagatccacc tttggtgaag 19980

ggctgctttc catttgatag atggctgtct tcttgtgtcc tcacatggtg gaaagggtga 20040

ggcagttttt tgaggtctct tttaaaagag aactaatccc attcatgtgg gggtctgccc 20100

tcatgaccta atcactttcc aaaggcccca cttcctaata ccatcaccct gggggttaaa 20160

ttttcaacac acaaattggt tggagagtga gcgaacatag acattcagtc tatagccccc 20220

agggatgtag ccactgaata aaataatcta gaacttcatc tagaggcagt ttataagtca 20280

cataagaaaa ccagttttac ttatagtcac ataaaacttt tgataaaaaa caaccctagt 20340

tgataagcca tttgtttact ggacttggct ctgaagaaat gacttttggc taatcctcaa 20400

aatgaaatct actcacagag ggcaagatct gccaccagtg aagatgttta aaacaatgtg 20460

ctgtaggctt tgaaggcaag tctaaagaag agcttctaaa aatattttgc acaatggtag 20520

cattaaaaga gtaggcacat gggccccaag ataacatctg tgaagaggag gaccagtgtg 20580

tgtttccttt tgtatgttta agtactaagt cagtgattac tttataatta aaccatattc 20640

ctcttgatct gtccataata aggtcactct gtaatttata ataggcttct taccaaattc 20700

aagctttaca acaaccctat aggttaaata ttcctgtgaa ttttatagat gaagaaacag 20760

agtaagtgaa agagttcata ctcaattcaa gtctcttgag tctaaaatca gtgctctctc 20820

tacataagaa gttagttgct aagatcacac aacttgagaa gagagaagac agttttcaca 20880

gtccctcccc tctgaccact aggctgcttg gggtactttt acaacttacc tgctctgaat 20940

taaggctctc tgtgaatctg attcatctgc caatttgcaa acagtcagcc ctgtagtacg 21000

tacctaagtt gatttttaaa atactatttc tcatcttaaa ataatggaaa ttgagtgaca 21060

taaatttcct ggacactttt taagatccaa agacaatttg ctaatttgtc gttacaatta 21120

aagagccccc caaaaggcgt aagaactgga ttttgacttg gacttctgtt ccttagtttc 21180

tttaacatat tgggggccgg gagtggtggc tcacacctgt aatcccagca ctttgggagg 21240

ccgaggcggg cagatcacga ggtcaggaga ttgagaccat cctggctaac acagtgaaac 21300

cccgtctcta caaaaaatac aaaaaaaaaa aaaaaaaatt agccgggtat ggtggcgggc 21360

gcctgtagtc ccagctactc aggaggctga ggtaggagaa tggcatgaac ccaggaggca 21420

gagcttgcag tgagccgaga tcgcactaca ctgcactcca gcctgggcga cagagcaaga 21480

ttccatctca aaaaaaaaaa gaaaaagata ttgggaaaac tcacttaaac tctatgggct 21540

tctgtaccac taaggcttct caaatttgat gcaagtaatg ggaacttgct gtggctaact 21600

tgagccacag gagaaggata ctgcaagact cacaaatgct tgaaagtttc ggaacaggtt 21660

tggaaatggg taagaaccaa ggaccgggtt gacctgaact gaaaggaaat tgaggtgcta 21720

ttagggacaa atatgaaatg aaggatgaac tgtctctgac atcctttgct tctgtgtttg 21780

gagatgagta agcagggagt gggtgcatat gcaaacaggg tggtcagaaa tgctttggcc 21840

ggatgtgtga ctgaaggcta tgtgcagctg aggaaggctg ggccaccaca gtagcagaga 21900

ggctgaccaa tttggcatgc agcaagcagg aagtagaagg gatcttaagc aagcaaagtg 21960

tttgggtaga caagattatg aggaatgagc accaatgaca tttccaacaa gcactgaaag 22020

cttccaaatg cttctaacag ttactgcctg tacaaacaca ggacagtctt gactatgtga 22080

gactgtgaca gtttcctcat gcctatgaaa tgagagacag tacttagcac tgacatgagc 22140

ttcatatttg aaggcagcaa actactgaac cacatgtagc ttccgaaatc aaaagatgca 22200

aactggcaga ccacaggtca gatatgacat gcagaaaaaa attagttact atcttagcct 22260

agtttgtgct gcttacagaa tatcagagac tgggtacttt atagagaaca caaattattt 22320

ttcatagttt tagaggctgg gaagtccaag atcaaagggc catcatctcg tgaaggcgtc 22380

cctgctgtgt caaaacatgg tggaaggcat cacatgggca aaagagagag agggaagcgg 22440

gggcaaactc ctttttatca ggcacccagt cctgtgattc attcatgaag acagtgtcct 22500

cctggcctaa tcacctctta aagctcccac ctctcagcac tgttgcactg gaaattatat 22560

ttctcacaca tgaactttgg ggaacacatt caaaccatta cagttaccaa agataaaaat 22620

gcagatttca gatttctctt ggggaagaaa aaaggctctg gcaataccag ggctgtattt 22680

ccacatggca acagttgtct gttgccttct gttgggttgt gggctctcac attgccatac 22740

cctcctcatg gcccccttca ctcataacag tacctgccta gacctcgaag cactagtttc 22800

caaccctgct tgagttaact acttccatga caactgtgca aggccagagt gtgggcagct 22860

accttgaggg ccaccggcat gggctgccca agtgaccgag ggcactaacc tctgctctcg 22920

aaacttcttt ggtaggatct cttcactcct gacttactac ttgtaactgc tggaaacaac 22980

catttattct acccctacta aaccacatct gtcttttctg tcagagccaa tcttcaagca 23040

tatgcttcct caaaagactt taattaccag gtagtagaag cggcagcaaa gagtccccat 23100

ctagcatctt ctaaaatgta gtggagaaac caacgacaac gaatctgaga caaccagttg 23160

tttgacttct ctgaaaacaa cctctaaaaa aagccttctc tcgtgaatag ctgcagacat 23220

gctgggcact aattgatgat gatgcccttt agtgagtctc ctctgcacat acctgattcc 23280

atttggatgc tggccctcac atacttctat ctgcgaactc cggaacacag aatatcatac 23340

aatgtatgat tcaatctgga ctctgctgga gccattctct acaaagcaga cacaactttt 23400

tcttgcctaa atcctttcaa gttgctttat ttttattttt aaactaatta ccataaatct 23460

aatttatcaa gctgctttta agataaactt taaaatgctt agagcagtct acaaattctt 23520

gcactgtttc actcttcctt atctctcagt cttcatctcc cattgcatct tctctgactc 23580

tttcatatgg atcttctttc aatttgtgga agaagccaag cttgttcctg cctcaggtcc 23640

ttgacacttg ctgttcactc tcctgggaga ctcttccccc catcttagct tttaaatacc 23700

agctggtcag actccttacc tgccttccac cttcctctca ttctcccact cctcgccttc 23760

atttctcaga gtcctccgct ctcttctttc tattgctctt aacacaattt gtctgttttc 23820

cgctaatctg taaactctac aagagcactt aactattttg catcccaccg aatattcgga 23880

gtcagcacag accccgtcat aatagagtag gtaagcaatg cttacctgtc aaatgaatga 23940

atgaaacacc cgattcatcc cccaagccag cttaatacat tagatgatct tatggactga 24000

ataagacatc cctcctttta aagaatattt ttgttttagc ttcacatcag caaaccccga 24060

acggttcatc ctaagataag cctggtagag aggaaagata ctaaccttct agggtcctaa 24120

agtggaacta ggaacttatt agatatgcac attctcaggc attatttccg atagcccagt 24180

cagagaattc tgggggtatg gcccagcaat ctgttttaac aaacctttca ggtaattctg 24240

atacacacta aagtttgaaa ggtttcttta aggctttcca gttttctttt cttttttgga 24300

gggatggggg ggggtctccc catgttgccc aggctggtct cgaactccta gcctcaagct 24360

atcctatcct cccacctcgg ccttccaaag cattgaaatt acaggcatga cccactgcgg 24420

ctcgcctccg tttctaactt aaaaaaattt tctttggagg ggagccttaa tcctttctat 24480

tatcctgcta gtagaatctt actactcctg agggtaatct ttgtcataat ccaaaagcct 24540

tgaataaagg cctatttgta tagttatgca gaatatattc ctgggaggtt tgccttccta 24600

ggagcacagg tcggccctgg gaggtggggg ttggggggca gggctgcatt ctaaagtcct 24660

gtaacaacgc acaagtacaa ctgaatagaa ctcggaacaa aggcatcagg gccacggtgc 24720

aagtctttgt tcatccgttc cccgactgct caccctgtct gataccgctc ttttccaccc 24780

agaaaagcag ccactcaagt tttaagaatg gatgtatgcc gcggacgttt tcgattaggc 24840

cgttttctct caggcactgg aggatattcg tggctgcagg aggcgcttcc accctttcct 24900

caacctagca aagaagtaac tgaaactaac ccaagggtta caaccgaaaa gccccttcca 24960

gcttcagaag cagaactgga agctcggata gacttctccg cctctacact cctggaaaac 25020

ccgcagtgga tttcaccaac ttcaggatcg gagcccaggc aggcgaacgt accttattgc 25080

gcatgctcgc tagcccctcc cgctcggagc ggaaggggga gcgctggggg cctgggcctg 25140

gcctggccgg ggcgtcggca ccggcggcca tcttggcttc ccggggaaag gcggcgtgag 25200

gggaagaagt tgtagggtgg gggcaggagt gaggaggagg gaagagagag ggggaggagg 25260

ccgcggcggg gcagggcggg gactgcctgc ctgcctgggt tgcggaagtg atagccgccg 25320

accgagcctg ctgctttctt gctactgctt cggcttcccg gctacccccc ggacggtgaa 25380

ggcggcccag ctgtggatgg tcagatagcc cttgtctccc gccgccaatc tctggcccct 25440

agcagcacgg agcagacggc ggcagcagca gcagcaggcg aggaggaaga tggcgggacg 25500

gctgccggcc tgtgtggtgg actgtggcac ggggtaaggg ggcttacggg cgggggtggg 25560

gaaactgagg cggaggaagg aagatggcgg gggagggagg aggccgggaa atgaatggtg 25620

cggcgaggtg ccgccgccgg ctgtcagtcc tagacccgcc ggccagcgag gggtggggcc 25680

cgcagccagg gcctcgcggg tcccctcgtt tctccctcct gggactgggg cgggggcgcg 25740

ggcccgagat tcaaccccca accctcccag cggctttctc cgcgcgaccc ctcccggccc 25800

ttcccccact acggtgggca gcgccgccca aagggcgctg gggacggtcg tcttgggggt 25860

ggtccccggg cccgacccat ccggctttcc tttccctccg cgcccgtttt tgccagtcgg 25920

tttggggacc caggggccga gctcggggac tggcctggca ggggagctag aaaagagaag 25980

cgctcctggt aggtttgaca agatcgctgt gacaacattc tgcccagggt gtgggtgggg 26040

aaagggaaga atcggactct gaaaatggga acctacagtg gggctttcat ttgaccaccc 26100

accttctcct ttcgactcct ggtcatttcc atctccctct gcgttttaac cggtgaacca 26160

agtcacattt taattcgagg gagaaagatg tcatgtgtta cttctgtagc ctcaaaaaag 26220

tcccccagtg agcaagcgcg ctgcaacttc cttagttttg tcaaagccgc ttcctgcttt 26280

cagtctttta tacccttata aggtagtttt tagtttccaa cctgagcaca tcttactaga 26340

acttttaagc aggttttaaa gagactgaat taccggtgct tggtgtccat ttatatgact 26400

taaaaaaatg tacttatgtt tcatggagtg ggggaaagga agcaccctgg aaaataaact 26460

aatttaagtt gtattcgttc attctgtgat ggtatcttga aggaagcagg aaggtataga 26520

ggtatatagg agggtgttta agttgcaaat agttactcgt agatatgtag ggtagtttgc 26580

gaaaatgtag agtggcttta aagtgtggtc gttcattttg tattaataga cgttttagag 26640

agttgtacca cactcataac tgcatagaga atagactacc cttattttta tgtagaatca 26700

ctgcttcagg atgacatata ggaaagtggt ttttttttct gtgctgatga catctctcca 26760

attcccagaa cactcccagt tttttttttt tgagggggaa gtc 26803

<210> 19

<211> 26803

<212> DNA

<213> Homo sapiens

<400> 19

gccgcaccta ccgctggcct cagacatcag caccccaaag ggtatgttgg agtcccatgg 60

tggaggtgcc ggccgctcct ccacgcactt gatgtatacc gaggatccca tgcttgacgt 120

cgcagggggc attagccagg agcacgttgc tgggatgcca gtccaggctg aggatggtgg 180

agccaatggg cttcttgatg tacttgcaca cccaccagtt attctcccgc tggaaataac 240

agatggcgat gacacacagc tgccgcccac agcaaacttg tcctgtgggc ccagcacaca 300

cagcaggcag tgggtgcggg cttaccctcc tggcccgtca gcgtccacac agaggccttg 360

tggcctgtgc cataggtcac gatgaggtta ctcttggagg cccagttgat gccttttacc 420

tgcccgttgt gctccttgag ctcgggcacc ttggcccact tggccccact cttacagctt 480

cgtggttgtt gaggcagatg gtggccatct gggtgcggcc cttgctccag gtttggcagc 540

aatgggttcc tgcagtcagc tgtgggaggc tgtagttgct ctccttttca gagtacccca 600

gctgcagact ctgggcagga cgcacccaac cagtgctctg gttttttgaa gtaaaaaatg 660

cataatgcaa ttttaccatc ttaaccattt tttaattatg aaatccggta gtgttaagta 720

taattgtgtt gttgtgaaac agatctccac aactttttca ttttgcaaaa ctaaataact 780

cctctttccc cctactccca agctccaggc agctaccatt tctgtttcta tgaatttgac 840

tacttatatt acctcatata aaggggttca taagtatttg tcttttcttg cttggttaca 900

tcacttagca tgatttctta agtttcattc atgttgtagc acatgtcaag atttcctttt 960

ttttttttaa aaaaaaggat gaagactatt cgtttgtatg tatatgccac attttgttta 1020

tccatccatt tttcttcaaa tgtttgagtt gtgtgatgtt taattatgtg tcaccttgac 1080

ggggcaaagg gttgcccaga cagctggtaa aacattattt ctgggtatgt tagtgaggct 1140

gtttccagaa gagattagca tttgaattgg caggctgaat aatgaagatc tgccctcatc 1200

aatgtggatg ggccagaaca aaccaaaaag gtggagaaag gaccagttat ctccccacca 1260

cccctgtgcc ctttagctgg gacatccatc ttctgccatc agacatcaga gcttctggtt 1320

ctcaggcctt cagactccag aagttatacc agtggcttcc ctggcttttg gactcagact 1380

ggggtttcac tgtatgtttc cctgattctc aggcctttgg acttgaattg aattacagca 1440

tgaactttcc tagttctcta gcttgcatat ggcatattgt gggacttctt gacctccata 1500

atcatgtgag ctaattccca taataaatct cctcttatgt atctataatt catatagata 1560

tgatatctat atatcaatcc catagataaa tagatgtctc atatatatat caatgtctct 1620

atatgtagat gtctcatata tggtatctat gtatctgtat catctctata tatctaatca 1680

tctaatatag atgtctcatg atatctatat agatatatct atatcataga tgcagagata 1740

tcatatatat gtctgtttct ttggagaatt ctgactgata caggttgctt ccgccttttg 1800

gctatcatga gtaatgccgc tgtaaccatg ggtatgcaaa tacttctttg agaccctgct 1860

ctgagttctt ttgggtaaat acccagaagt ggattgctgg atgatttggt ggttctactt 1920

ttaatttttt gaggaaatgc catactgttt tccataatgg ttgcaccatt ttataatctc 1980

accaagagtg cacagggttt caatttctct acatccatac caacacttat tagtgtgtgt 2040

gtgtgtgtgt gtgtgtgttt aatggctgtc ctaatgggtg tgaggtgaca tttcactgtg 2100

gttctgattt gcacatctct gataattgct ggtgttgagc atccttccat atgcttgttg 2160

gtcatttata tatcatcttt ggaaaaaatg tctattcaag tcttttgtct attttttttc 2220

cttccaactt ttattttagg tctgggggta catgtgcagg tttgttacat ggataaattg 2280

tgtgtcatgg gggtttggtg tacagattat ttggtcgcct aggtaaatga gcatagtacc 2340

tgataggtag ttttttgacc ctcccccttc tcccaccctc caccctgaag taggccccag 2400

tgtttattgt tcccttctta gcatctgtgt gtagtcaatg tttagctccc acttataagt 2460

gagaaaatgt ggtatttggt tttctgttct tacattaact tgcttagaat gatggcctcc 2520

agcagcatcc atgttgctgc aaaggacatg atttcgttct tcttatagct gtggtgtata 2580

tgtaccacat tttctttacc cagtccactg ctgatgggca tctaggttga ttccatgtct 2640

ttgatattgt gaatagtgct atgatgaaca tatgtgtgca tgtgtctttg tggcagaaca 2700

atttacattt ctttgggtat atatccagta atggggttgc taggtggaat gattaattca 2760

cttttaagtt ctttaagaaa tctctaaacc tctttcccca gtggctgaac taacttacat 2820

tcccaccagc agtgtccaag tgtttccttt tctgcacaac cttactaaca tctgttattt 2880

tttgactttt taatgatagc cattctgact catatgagat cgtatctctc tgtggttttg 2940

acttgcattt ctctgatgat tagtgatgta gagcattttt tcaaatgctt gttggccgca 3000

tgtgtcttct tttgagaagt gtctgctcct gtcatttgcc cactttttaa tgggcttgtt 3060

tgttttttgc ttgttaattt aagtttcatg tagattctgg atattagacc tttgtcaaat 3120

gcatagtttg tgaatatttt ctcccattcc ataggttgtt tactctgttg atagtttctt 3180

ttgctatgca gaagctcttt agtttagtta ggtactactt gtcaattttt gtttttgttg 3240

ctttgtccat tttaaaaaat agagtaattt gattattttg ttgttgaatt gtaggaattc 3300

tttatatatt atggatgcta acatcttatc aaatatgatt tgcaaaacat tttccctcat 3360

tctgtaggtt gccttttcac tattgtgtcc ttcaatgaac aaaagttttt atgtttgatg 3420

cagtcccatt tgtccatttt ttttggttgc ctgtgatttt ggtgtcatat ccaagaatgt 3480

ggaatgtgtc atatccacat tcaatgtcct gacgattttt ttctatgttt tcttccagaa 3540

gttttattgc tttgggtctt tggtttaagt ctttagtcca ttttgagtta atttttgtat 3600

gtggtgtaag aaacaggtcc aactgcattg ttttgcatgt aaatatccag ttttcccagc 3660

atcatttgtt gaccagactg tccttttccc atttagtgct gttggagctc ttcttggagg 3720

tcagttggcc atgtgtacac aagtttattt ctgggctctt tattctgttc tattgatttg 3780

tatatctgtc tttattccag taccacactg ttttattctt ctttttcaaa attgtttgac 3840

tcttagggcc ctttgagatt ccatatcaat tttaggatga attcttctat ttctgcaaca 3900

aatgctattg gaattttgat aaggattgaa ttgaatctgt agactgtttt gagtgatatt 3960

aacatcttaa taatattaag tctaatccat gaatgtgaga tgtttctatt tatttatctc 4020

ttctttgatt tctttcagta atgttttata gttttcatta tataagtttt tacttcctta 4080

gtcaatttct aagaattgtt ttctttttga tgccattgca acgggaatca ttttcttaat 4140

tttttcagat gctttcacta tttgtgtata gaaatgtaac tgattttttg tatgtgtgtt 4200

gattttgtat ctggtaactt tactgaattt ttaaatttgt tctaacctgt tttttttttt 4260

tggtggaatc tttaggattt tctgcatata agatcatgcc atctacaaac agaaattttt 4320

acttctttct tcccaatttg gatgcctttt attgcttttt cttgtctaat tgctttggac 4380

tggagttcca atactctgtt gaatagaagt gtccagaaca gacatttttg ccttgttctt 4440

aatcttagag gaaaagcttc cagtttttca ctgagtatgc cgttagctgt ggacttttcc 4500

taaacaacct ttattatgtg caggtaattt ccttctcttt ccacttttga gtgttttttt 4560

tcttttcttt tctttttttg tgtgtgaaag gatattgaat tttgccaaat gcttttcctg 4620

catcagtgga gatggtcatg tgggttttgt cctttattct gtaaatgtgg tgtactacat 4680

tgattttcat atgttgaacc atccttgcat cccagggata aatcccactt gatcatggtg 4740

aatgatcttt tgagtgtgct gttgaattta ttttgctagt atttttttga ctacgttcat 4800

cagacatatt gggtaattat ttattttttc ttgtagtatt tttgcctagc tttgatatca 4860

cactaatgct gcccctcaaa gaatgacctt ggaagtattc ctttctcttc agtttttggg 4920

ggattgatgt aaattctttt tttttttttt ttggagacag ggtctcactg tcacccaggc 4980

tggagtgcag cggcacaatc atagctcact gcagcctcta actcctgggc tcaagcaatt 5040

ctgcttcagc ctcctgagta gctgggacta taagcatgtg ccaccatgca cagctaattt 5100

atatatatat aatataatag ataaatatat atatatatat atatatatat atatattttt 5160

tttttttttt tttttttttt tttttttttt tgcagagaca aggtaggtct tgctatgttg 5220

cccaggctgg tctcagactc ctaggctcaa gtgaacctct cacctcagtc tcccaaagtt 5280

ctgggattac aggcatgagc caccacgtct ggccagtgtt aattcttcaa tatttggtag 5340

aattcttcag tgaagtcttc tagtcctggg cttttctttg ttgggaggtt tttaattacc 5400

aactcaattt ccttactagt tattggtcta tttatatctt ctatttcttc atgattcagt 5460

cttggcaggt ttggtgtttc tagaaattta tccatttctt ataggtcatc cagtttgttg 5520

gtatagttca tagtcttctc ttataatcct ttcttatctg tagctcagta cctcctatct 5580

ggagatgcag aattaggaat tgaaactata ataggccccc cttttataat ggggtgtcct 5640

tatttttacc ttctcacctt gcaataccct tgtcttgcta gtaaagaaag aagggaaatt 5700

tgattcagga ggtaatcata cttttcaatt tgtacaagat ctaatagcca tgaactccta 5760

tgtcattcct caccatccca taattcttag cccagccatc atccttacct caatccctgc 5820

tggtgcagcc tggtttattc tgttaatgtg ctgtactgca ttgaggtaag gacttctgct 5880

cagctttctt cttgatacca ttgtaccttg attcacactt cctcttgtga aataaagttt 5940

agcatgaagc tgctttctta catattttaa gttcggctta aaggtttttc tgtacatcgt 6000

gaactgtaac aagtggaata taaccagacc gtagcttaca cttgtgccat ttaccaagtt 6060

ttggccaatc aaatgtagcc aactgtttga actgtattca aataagggaa atgctcagct 6120

gtaaccaagc caactgtttc tgtacctcac ttctgttttc tgtatgtcac tttccttttt 6180

ctgtccataa atcatcttcc atggcgtagg tgtgctggag tctcagagtc tattctggct 6240

caggaggctg cctgattttg aatcattcat ggctcaatta aacttcttta attttttttt 6300

tttttgagat tgagtttcac ccttgttgcc caagttggag tgcaatggtg cagtctctgc 6360

tcactgcagc ctctgcctcc tgggttcaag cgattctcct gcctcagcct cctgagtagc 6420

tgagattaca ggcacatgcc accatgccca gctaattttt ctatttttag tagagacagg 6480

gtttcgccat gttggccagg ctggtctcga actcctgacc tcagcctccc aaagtgctga 6540

gattacagat gtgagccact gcacctggct tcactccttc aaatttaatt cagctaaagt 6600

ttttattttt ttctctttct tttttttttt tttttttgag acagagtcac tgtcacccag 6660

gctgaagtgc agtggcacaa tctcggctca ctgcaacctc cgcctcccag actcaagcga 6720

tttctggcta atttttgtgt ttttagtaga gatgggtttt caccatattg gccaggctga 6780

tcttgaactc ctgacctcag gtgatctgcc tgccttggcc tcccaaagtg ctaggattac 6840

aggcatgagc cactgtgccc agcctcaaat ttaagaagaa acagttaaca tggacttgca 6900

tacctccagg atattgtgaa tacctctcaa tatttttcta agttctcaaa gtcaaattag 6960

actctatgac aatcactcaa ggttcccttt gtttccaata tgttgatgac ctgctacttt 7020

gcaaccaaag caaacagggt gctcttctgg actcccttac tcaccttaag gcactgactg 7080

actaaggtta taaatcttcc aggtccaaat gccaacaggt acaaaaaatt cttacctact 7140

taggccataa aatattttag ggtactcaaa aactcgtccc aaaatgcctt gaatcaattt 7200

tattcattat ctctcaaaga caaacaatta cgtgaatttt taggagcaac tggatattgc 7260

caatggattc ccaattttgc tgcccatgtc taacctttat atgctgtcct cttagataca 7320

accacagagc actttacctg gtactctgag gcaccagcct ccttggaagc attgtccaca 7380

ccccagccct tcgactaccc aactttgaca atctttttta cctatattac tgtgaaaatg 7440

atgggattgt tgtgggtatc ttaggacaat ctttttgtcc cataacatat ttctcatgtc 7500

aacctagata tgtcccacag tacctttctc atgttaagta gcatcaggca ttcctccatg 7560

cttatatgca atagacttag ctgccatcct aattgacaaa gcaagtattc ttatactgcc 7620

ccaccattca cctctctgtt ctccatgctg ttcctctaca ttggtatccc tttcaaagtg 7680

gatcttgcct caactaaccc ttaactgttt tttttttgtt tttgtttttt gttttttgac 7740

aattctggca ctaccccaac acctgcttgt tccaatcttt caaagcctgg ccaccttaaa 7800

tagttaatct ggttactggt taggttaaca tctacataat gcagaagagt ttttgttcct 7860

accaatgtaa atatacctgg tgaacccatt ctggacaatg gatatataaa agcatatggt 7920

atccataagc aggaagacaa agtcactctg tctcctcctc tggtagatta atttggcact 7980

gggaagcctc catggaagct caaggtcagt gctttaccca agtaagacta ttggaaggaa 8040

atctctctac attgaaaata aatacagtac tggacctttt ctgggtaaca tttcaaaaat 8100

gtattgcaat caaattctgt gatttggctt cacagatggc actaaacaac cctccactgt 8160

cattgttact tggattataa ctaagtattt caatgtgagt gaatgtcaga ttacaggata 8220

atattcctgg tttgtaggaa aaagtagtgg gatatggaat agctcaagtg ttcccctagt 8280

tggcttgacc agcacccatg actatagttg gatggatgga ccttaacttg gtcaataaat 8340

aaaatacatt tctatagtaa ccaaggctaa attaaagggt ttctctgcca ggtgtttcac 8400

aacctgtttt accctcatag cctaacagaa gcacattgga agtgaagatg tgcagatgcc 8460

aacatgattg atgataaggg ttgtgaaaga cacagaattc caacttggtt gttcacaggt 8520

tccaccacta tgaccttgtc tgtaaacaac actggtctct ctctcttttt tttttttttt 8580

agaaggaatc tcactctgtt acccaggctg gagggcagtg gcacaatctc agctcactgc 8640

accctccacc ttccggttca agcgattctc ctgcctcagt ctcccgagta gctgggagta 8700

caggtgccca ccaccatgcc cggcttattt ttgtagtttt agtagagaca ggatttctcc 8760

atgttggcca ggctggtctt cacctcaagt gatccgccag cctcggcctc ccaaagtgct 8820

gggattacaa gcgtgagcca ctgtgcctgg cctggtctca tttttatgta gcaataagat 8880

atataaaagg ttcccaccta agtggtcaga gaaatgtgaa gttggatatc tggtgccttc 8940

ccttaccaga tatcccactt tgaatgctag ccacattaca actggggttc ttttatatat 9000

aaattaatgc catgtagatg cacctgatga gacatcatag acaacgcact tatgtattgc 9060

aaccctaagt tctcagtaat gagaatgctt ttccaaagcc tggcaatgta cgatgtagaa 9120

agaacaatcc taagcattcc aaagtaatga acaagcatct ggtgccacta tacagactgg 9180

gaagcctgcc atttacaagt tagcagtgta gcctctgttg cactccaaaa ttgtgtccta 9240

gatatgctga ctgcccaaca gagaggagct tgtacaatca ctggcaacaa tgctacttct 9300

atataaatta gaaaggaaaa attgtgtcta atctatatca tttaaaaaga aaggttggcc 9360

gggcacggtg gctcacgcct gtaatcacag cacttcggga ggccgaagcg ggcggatcat 9420

gaggtcaggg gatcgagacc atcctagcta acatggtgaa accctgtctc tactaaaaat 9480

acaaaaaatt agccaggcat ggtggcgggc acctgtagtc ccagctactt gggaggctga 9540

ggcaggagaa tggcgtgaac atgggaggcg gagcttgcag tgagcagaga tcacaccact 9600

gcaccccagc ctgggcgaca gaacgagact ccgtctcaaa aaaaaaaaaa aaaaaaaaaa 9660

aaaaaaaaaa gaaaggtcaa cattctacgt taggtaaata aggcatagtc caattaactg 9720

aactgaactg acctattccc acgactggga gactggttca acagaatatg gaccagtgtg 9780

ttcagatttt tctctgttgt aatctatgtt cttctttcat tttgcagatc tcttacctcc 9840

cagcacctaa tatgagtctt ttctacatag gaaataatcc aaatatttgt gaaacttcat 9900

gtgaagtttc aaatggggga agtgaaggaa cgaacaaccc acctcctaac cccaatttat 9960

acccacctgt gttagttcat ttgtattgct atgaagagat acctggaggc tgggaaattt 10020

ataaagaaaa gaggcttaat tggctcacag ttctgcaggg tgtataggca tggcatcagt 10080

atgtgctcag ctcctggtga gggcttcagg gagcttacaa tcatagctga aggtgaaggg 10140

ggagcatgca tcttacatgg tgatagaggg agcaagagag agggtcgggg ggtgccaggc 10200

tctttaaaca accagctctc atgtgaaata ccagagccag aactcactca tcaccatggg 10260

gatggcacta agccattcat gagggatctg cctcatcacc caaacacttc ccagtaggcc 10320

ccacctccaa cttggggatt gtatttcaac atgacatttt gaggggacag atatccaata 10380

ttcaaaccat atcaccacca gaaaggcata aagattactt taaactgaaa atattggaac 10440

aaacaatcgc tgcggaaagc agccttatct gaccgaaagc agacctgtcc aagagttctg 10500

ctatcatcaa ctccttctga gggactttcc agacagcgag gtgacagatg tttacaaacg 10560

tgacgttaaa aaataaagtt gtgtaaatga gtcttatcag aaccttttat actttctcac 10620

tgaagcctca gttggtatat aaacccttac cactggctgt ttgggaagtg actccttaca 10680

gagtgctccc tcaggcatgg agaataaact tttctcctgt taatgtattt tcaactaatt 10740

cgcaggccct agaccactca gatctaagtt gacagatgaa atgttttcct cccaacatga 10800

ccaagcttat agtgctttta tggtatatct gtagagattg cggtcaggca taacattgtt 10860

tgttagggtt gcagtacctt tcaggaaatg ctcaaagttt aattgattta ggggactttc 10920

actggatgag atgcctctct gagtcatcat aggttgcaaa gtattagttt tttgccactc 10980

actgtgtgtt gtgatatgac atactcataa tggggtagga caagatgtca gttttgcttc 11040

caaactttcc ttacttgttt cctttttggt tcaccactaa tgttgaagaa atgcaagatg 11100

gaaaatctca atagttgaca ctgattgatt gattgagatg gagtctcact ctgtcacctg 11160

ggctggagtg cagtggcgtg atatcggctc actgcaacct ccacctccca ggttcaagca 11220

gttctcctgc ctcagcctcc cgaacagctg ggattacagg tgcccgccac tactctcagc 11280

taattttttg tatttttagt agagatgggg tttcaccatg ttggccagac tagtctcgaa 11340

ttcctaacct tgtgattcgc ccgcctcggc ctcccaaggt gctgggatta caggcatgag 11400

tagttgacat ttattaagtg tttatatgtg ataagcactg ttagattatc ccatgtaata 11460

catcacttga ttgatttaag agattgtcat ttgaaagatt aaagaatatt tcccagaaag 11520

gatgcttggt caagcctcat catcctggga tggatgggac cttggttttg ggcaagttta 11580

ttacaattta agactattct aggtcatgga agtgtgtgtt aggacatata agtagttttc 11640

ttgtccagaa tactttgtaa taatataccc taagtttgat cagctttttg gcattcactt 11700

aattaaaatg ttcacaagta ggtacatttt tagaattgtt aagtaatata ctatttgtag 11760

tagcaaaaca ctacaaacaa atacctaata taataagagg gagtggttga ataaactagg 11820

gcatgtcaac taaaaaacat atttgaaatg cagggaaaat gcttactcta ggcaatagtt 11880

acaacttttg tccattatag gtacataaag gaaaagagta cacaaagaat tctattaatg 11940

atgaaattag gaacaatgtt cccatcccca atttataccc aaaagaaaat atgttctggc 12000

tgggcgcggt ggctcatgcc tgtaatccta gcagtttggg aggctgagac aggtggatcg 12060

cctgagctca ggagttcaaa accagtctgg gcaacatggc aaaaccccgt ctccaccaaa 12120

aatacaaaaa attagccagg cgtgatggca catgcctgta ggtccagcta cttgggaggc 12180

cgaggtggga ggatcgcttg agctcgggat gtggaggctg cagtgagcaa agctcacacc 12240

actgcactct agcatgggtg acagagtgag accccgtctc aaataaataa ataaataaat 12300

gaaaacttat attctataac atgtattctt atgtctttgg ctaaaacaaa agagaagaaa 12360

aataagtaga gagctaagtg aagtgaagtg tcttgaaaca gataagccat aaagtgagat 12420

atatgagtaa atgagtagtt gctggcctag gaattgtttc tgatgttttc acctattgaa 12480

agaatttttt tctttttgta aatctttttt ttggtttgtt aaactgaaaa ataaaagcaa 12540

tgaagagata atattgctgt agtaatgtcc cttagtgcat ccttggagtt agttgtcttg 12600

aatttggcct gctctgattg tcatttgctg tttgctgcat tgaaaaaatt tcagatttac 12660

aaaaatatgt gtgccagggt ggaggaaatt tttaacttga tgaattctca cctttaggac 12720

actgtctgct cttatatggc acttagcaag atgctgcaac aattgtccct gctcatactg 12780

ttggaggaag agggtatttg cagggagatt gctggagtca agatgatcca aatttaaatt 12840

gcagtggtga gcagtggcca ctagagggct gtgaagtact taattctaaa atttccacat 12900

tttaatctgg agcagaggaa actctggaag gaccactggg actaagggag ctcaatccca 12960

aacatcttta tctgagccct aaatgtcttc tacgttattc tttgacaata ctttgttaca 13020

tctcagaatt tgtagttttg aggtggaggt ttaagttaga aatagtttaa tatattctat 13080

tccagaatat aattcgcttt tttccaaatg aaactggcac taaaagcttt ttacttgaaa 13140

gcaaatacac ttcatatgct ttatgtattt ttgtccctat atcattgaaa tagtagattc 13200

aaggctgttt gtaaaaataa gtgactatac tgcatatagg aatagcccca ccttaaagac 13260

tttgatttta aggacattaa gtgggagggt cttttttgcc tttttttttt tgactatcaa 13320

aatactttca catttcttca attcaaagaa caactgttct aaatttagaa gacagacaag 13380

tgaaagagaa tatgctgcca tttccgatgg ttctttttta ctcttgatcc atcactctcc 13440

tgtctttggc tgactctttc tccaaaaagt accccttatt tttcctatgc ctttaacttc 13500

tgttttactt actctattgt agaactttga gaagttgtac accacattca ctgctacctc 13560

acattaactc tgcttactca ttgcagtctg ccttctgctc ctcaatgatt gctcctgtga 13620

aggtcatctt tggtttagca cttgtttgaa atctaatagc ctaaatgcac atcgattact 13680

gtttagaatt caaacgacat ttatttattt actttgagat ggagtttcat tcttgtcgcc 13740

cagctggagt acaatggcat gatcttggct cactgcaacc tccacctccc aggttcaagc 13800

gattctcctg cctcagcctc ctgagtagct gggattacag gcaccctcaa ccacgcctgg 13860

ctaagttttg tatttttttt agtagagatg gggtttcgcc atcttggcca ggctggtctc 13920

gaactcctga cctcaggtga tctgcctgcc tcagccccac aaagtgctgg gattacaagc 13980

gtgagccacc acgcccggcc caaatgacat ttatttttaa aagcaactaa accaggaaag 14040

accttcactc attcaatcaa aaaacatgca ttgaacacgt attcttggct agatccggtg 14100

ctgcaaagat gaaagacgcc actcctagcc tcaaggagct tgcagtttag tggtggcact 14160

ggatgtaaaa taatcataag atgtgaggtg aagactgatg aggtctattt tgttgacaca 14220

ggtaaacatt ctcagagaat atttaattag caacatgaca aaaattagtt gatttatttg 14280

aaggatattt aagtgaattt agagatgaga tttgttttta cttttttaat ttcagagagt 14340

tatgttggtt gcaaaaatct ttgttttcta gtatctattt tataagccat ctgagaccag 14400

gatgttttct ttttaacatg taaacttgat gcagtctctt tgtaaagtaa tgaatccccc 14460

cgtgaacctc aaggagaaga aagtttagct tgaacactta atttcaagta ccttgagaag 14520

ggaacaggct gtattgctca gagaagaagg ctctattagc taaggtagaa ggacaatgta 14580

aaactcttgt gaagacacct aaatgtcatt ccactcaaag cccattatta ataatttgaa 14640

actgtctgct ctgtgaaggc aacgacctat ctttactcat ttttgactct gctaacattt 14700

ctttttatag ttgaactaga ggcaaggcaa ggaacttgac atgcttgttt tccctttaga 14760

ataaagtggc cagaagcagt ttcttctgtg tgatccaaca ctttcttatc cccagagcaa 14820

ctctgcatag tctagatgta ccagagccca gcagcctgtg aggtgatgtg atgtgatgtg 14880

atgtgaacag aaaggctcca tgttggatga tgcctatgaa tctaatcaga ttctctttct 14940

tggtcatttt gatttccaga gaaggcagta gaagcaggtt ctgtgtgtat aaccagagac 15000

tagagggagg aactgacagg gaagctgggt catgagagtg gtgtgctcag cagagtaggg 15060

agtaagagag agctggctcc agagaggatg acaaaatgcc catgtctcca gcacttcttt 15120

agcattctga gttcccatcc tatcatgaat aggaagagtt ttctagctct ccatgaagcc 15180

gaaataggtt tcagactttc ctttctttcc cacacacata ataaataccc atcaggtaac 15240

ctgggcatgg ccttttattt aggcactaac aattctaaaa ggaattaata aatgcttcac 15300

tgccatttca cagtgtaaca gcatgccagt ttaccatacc attaacattt agcctcgtgg 15360

tatttctgtg ttttttcagt cagtaatgat ggcatttttg ccaagataat atagtgttaa 15420

actgtattgg ttgaaatcct aggcttttta aatgtaaact agcactttac aaagtattac 15480

aaaggaaacg aaccagggaa acttgagaag gaactttctt atccacattg ttataggtta 15540

taaaatagtt cctatttaaa ttaaaatacc tactgttgca cttttatgtg tgtttttata 15600

tataaataac atctgggttg gcaaatatgt gattttcgtc aaataggctt tgattgaaga 15660

tgaaatattt ttgtaaaact agtccttttt taaagttaaa attttatgtt accacatgaa 15720

ttgatcagca gaaatttatt tacattatgt aaattgattt ttaagagtat ccacaaggtt 15780

ttagctatta tttttgaact tgcttcctag cccacacaat taagtaataa gagtaagaaa 15840

aaagaaagca cacatccaaa tcatctatca aaacccagct tctacccaat gacacatcat 15900

tttatttctt gatcttgtaa tgttgagcac atgccttgga catattccta tatgtgggct 15960

ctattctctg cagcacgtca ctccctcttt tatccgcccc tcttatgtgc tcccactcct 16020

atcctcttca attaaaaatg cctctttctt ttttttttaa gttaattaat taattaattt 16080

ttttttattg atcattcttg ggtgtttctc gcagaggggg atttggcagg gtcataggat 16140

aatagtggag ggaaggtcag cagataaaca agtgaacaaa ggtctctggt tttcctaggc 16200

agaggaccct gcgggcttcc acagtatttg tgtccctggg tacttgagat tagggagtgg 16260

tgatgactct taacgagtct gctgccttca agcatctgtt taacaaagca catcttgcat 16320

ggcccttaat ccatttaacc ctgagtggac acagcacatg tttcagagag cacagggttg 16380

ggggtaaggt catagatcaa cagcatccca aggcacagga atttttctta gtacagaaca 16440

aaatgaagtc tcccatgtct acttctttct acacagacac agcaacaatc tgatttctct 16500

atcctttccc cacctttccc cctttcctat tccacaaaaa ccgccatcgt catcatggcc 16560

cgttctcaat gagctgttgg gtacacctcc cagacggggt ggtggccggg cagaggggct 16620

cctcacttcc cagaaggggc ggccgggcag aggtgccccc cacctcccgg atggggcggc 16680

ggctgggtgg aggcgggccc ccacctccct cccagacggg gcggctggcc gggcgggggc 16740

tgacccccca cctgcctctg ggacggggcg gctggccggg cgggggctga ccccccacct 16800

gcctccggga cagggtggct gctgggcaga ggggctcctc acttctcaga cggggcagct 16860

gccgggcgga ggggctcctc acttctcaga cggggtggcc gggcagagac gctcctcacc 16920

tcccagacgg ggtcgcggct gggcagaggc gctcctcaca tcccagacgg ggcggcgggg 16980

cagaggcgct tcccgcatct cagacgatgg gcggccgggc agagacgctc ctcacttcct 17040

agacgtgatg gtggccggga agaggcgctc ctcacttccc agactgggca gccaggcaga 17100

ggggctcctc acatcccaga cgatgggcgg ccaggcagag acgctcctca cttcccagac 17160

ggggtggcgg ccaggcagag gctgcaatct cggcactttg ggaggccaag gcaggctgct 17220

gggaggtgga ggttgtagct agccgagatc acgccactgc actccagcct gggcaacatt 17280

gagcactgag tgaaccagac tccgtctgca atcccggcac ctcgggaggc cgaggctggc 17340

ggatcactcg cggttaggag ctggagacca gcccggccaa cacagcgaaa ccctgtctcc 17400

accaaaaaaa tacgaaaacc agtcaggcgt ggcggcgcgc acctgcaatc ccaggcactc 17460

ggcaggctga ggcaggagaa tcaggcaggg aggttgcagt gagccgcgat ggcagcagta 17520

cagtccagct ttggctcggc atcagaggga taccgtggaa agagagggag agggagactg 17580

tggggagagg gagagggaga gaaaaatgcc tctttcaata tgtaaggtaa gattgataga 17640

tgattgcctt ccgtagttcc tcccaaaatt cataggttga aatcttagcc ctcagagtgg 17700

tggtattagg aagtatggag cctttgggag ataattagct caggagggtg gagccctccc 17760

gaataaattt aatgccttta taagcaagac cccagagagc cctttcaccc ttttctaccc 17820

tatgaggaca cagcgagaag acagctgtct gtgaaccagg aagcaggccc tcactacata 17880

ccgaatctac aagcaacttg atctcagact tcccagtctc ctgaactgcg agatataaat 17940

gtttgctgtt taagtcaccc agtctaaggt atttttgtta tagcagcctg aatggactca 18000

ggcggtaggc aagaggagga cagtgcacct gagttataca ttgggcaagt catttacctt 18060

cattggagcc tcggtttact tgtgttagat atgggaataa tgatagttac actgcagggt 18120

ggttgtgaag attagagaaa gtgcatatac tctgatcagc acagtgcatg gtacttcagt 18180

acacagtgtt aactgaagac acagtgttaa ctgaagacac agttgaaaac taaagatagc 18240

tagtgaaaca catgttctct gcacatcata cagtttcttg ggcagttttc aaagtgtgac 18300

tctgcagttc ataccaccat tatcacttag tctctaacaa ataatcatat ttgacacatt 18360

tggctgggac ttaataattt tatttgggca gcagctggtt tctggaagtg ttcatgggaa 18420

gaaaatgtat attaataaag ttagcaggta atgttctttg ttgaaatgtt ggatattgtg 18480

ggacacaaaa gagtcagggt aaatgtacat ttacagaatt gagcgtcaga gtgtcatagt 18540

tctctaatga tttacaaaga aagaattcct ggaacaagtg aaatacttaa taattaattc 18600

agcctgtatt tctgcaggta atcaactgca gtgataaaaa aataaaaatg gaactgtctt 18660

ttgctcattg gaaagatatt tgctgcattc aaagtcatca aaaaggcgaa gcaatgaaac 18720

ttaagacttt tgggttttaa taattaaaaa tccatcttaa agagaacctt gggctctggc 18780

acggtggctc attcttgtaa tcctagcact ttcggaggcc caggtgggcg gatcacttga 18840

ggtcaggagt ttgagaccag cctggttaac atggtgaaac cccatctcta ctaaaaatac 18900

aaaaattagc tgggtgtggt ggtgtgcgcc tgtaatccca gctacttggg aggctgaggc 18960

acgagaatca cttgaacctg ggagatggag gttgcagtga gccaagattg tgccactgca 19020

ttccagcctg ggtgacacag tgagactctg tcttgaaaaa aaaaaaaaga gagagagacc 19080

gtttgtgaag gtgtgttaca cagagaattc ctgattccta atctccagaa tagaaaaatt 19140

caaaggctca gaatcatccc aaatcaatta tccagtggca tctgcatttt ccgatttcat 19200

tctcactagc cgtgtgaaca tgggcatgac cccaggagcc aaggaattct ctaatgccta 19260

aggacagcca tgaggtcaat gaataacatg tgtcaggttt ccctggcaca gaggagcttc 19320

ccagtaaatg ttattttcct tagctatttc ccatttaaca tgtcaattat tcttagtgag 19380

tttccattca atatgagagt ttatataatt tgtcatattg aataggaact tgctaaggaa 19440

agctgtgtag cagaggaagc agccccaagt gacaggacat aaactttaaa ttcacaagat 19500

gcttgtatgt gaattatgat ggtatctgaa ttaacagtga tatttacagt ttagtaatac 19560

atttttcttc ccttgtcttg ggctttataa aaaccctgta agtcatgtat gtcaggaatt 19620

ttatcctcat aattgagaga aaaatactcc atattttatt ggaaataaga tcagtagatt 19680

ctctgtatat catacaatgt cttgcctact taaattatca ccccccttcc tatttcaaca 19740

aagactttct ctaagtaccc ctggcctctt gccctgatcc atactgttct ccttggtaat 19800

ggagtgagtt tcctgcctgg tgggtgcagc cattggccac atttctctag tgtatggaac 19860

tcaccggata aaaggcctca gatgtaggtc tctttctgct gtcttcaccc aggtgttgtg 19920

gagtgtgtct gtccttgagc actagctttc ccctgtgtgg gctgcctcaa ggcctgcatt 19980

catcaggtag ggactgttag ctggtagacc taagccacca ctccagtact gactgtcagt 20040

aaggaaggtg acatgctgac ctccatctgc tacatcattg tgtatatgtc ttcattagtt 20100

ctgcatattg gtgagaaaat ggatgctctg attcctcttg aaccccaaga gaatgaaggt 20160

aaaaaaattg aggtcctaat gcaaattttc ttagtacacc caaatctttg gatagagtcc 20220

tgcactcttt gagatatatc acacaatctg tctcactttc ttttcgcata tgttatatat 20280

tttaaaactt ttgtttttgg ggccaccact tactggctct gtgattttag gaaagctttt 20340

cagaccctca gaaccccagt ctcttcatct ctaaagtaat aaaatatatg taaagaacct 20400

atttcagcat gtgaattctg ttttcctttt tcctctagat gtatcatatc cagttaaaaa 20460

aaaatctact tgaactttgc aggtatcttc agtgtttatt acttctcatt tttaacattt 20520

attggaaatt agcatattgt cagaattgat ataatacaat atgtaacctc tttcattaag 20580

cttatcattt ttaaaataca aataactatt ctttacttaa atttttattt ctagacacag 20640

ggtcctgctc tctcgaaccc aggctggagt gcagtggcac aatcatagct cactgcagcc 20700

tcaaactctt gggcttaagt gatcctcctg cctcacactc tggagtagct gggattatag 20760

acctgagcca tggtgtccag catgacttaa attttgaata agttgcactt actaattaca 20820

cttacactgc tgcatctgaa agagtaatac aacaatagaa gccttttata gtaattattt 20880

gtggcaggta gactcctaaa atgactccca aatgacccac acccttgtac aatcaatacc 20940

ctgtcccttg agtgacagtg acttgctcta atcagttggc tttcagttaa tcaaaagaga 21000

gattatcttg ggctgaacta aactaatccc agcaagataa cagggacttc agtcttgcaa 21060

acagatatca tataaaggga atcatatctg cacatttgat tcttggaccc tgggtaggaa 21120

tttgttagag agcaaggatg tgaataaagg tgggaaataa aggtgtatct ggtgtctctg 21180

ctcaaaagct cacatgtagc tacaaggcag agatttaggg gagtggtatc cacagtcaag 21240

aagaattaat acatagtgtt tgagtctggc ttcttccaat tagcataatg cttttgaggt 21300

tcatccatat tgttgcatta ccagtagttt ttatttattt attttatcag tagtttctaa 21360

attgttgagt agtatattac attgtgtaga tatatcctgt gtgtttatcc atacacattt 21420

atggatattt gggagttgct agtttttagc tattctatga gcattcacat acatgtcttt 21480

gtgtggaaat aggttttcat atctcttggg taaatatacg ggagtggaat tgctagatca 21540

tatggtaaat actctgtata cttaaaatga agagaaactg tcaaactatt ttccataatg 21600

gctctaccat acttgatgtt ttagaaaaga ggaaaaacac tagcaatttt gatgctgtat 21660

gtctacaacc taagagaatc taataatagc gtcctggtct gtcagtgtag gaattgccta 21720

ggtaatacat ggaaggtgtg gagggagcag gtacacagaa aatgtgcgtc agaaagtttt 21780

gcttttccta tcccacgtca tttctgagtc tgatcctccc tactcctcac aaataaattg 21840

gtagattcat ctgtttttgg acccttttct gctctagtta ctgaactatc agagacttca 21900

ggaagagctt aagctaagct attccaggga agttttggtg ttactctgta cttacggact 21960

cctgcgtgtc tgtctctgtc accccagctg ccaactcaac ttagagttta ttagcctggc 22020

attgaccagc acactgtgat attctctgag gcacactgca tgctgctagt gtgccctggt 22080

tcataaagct gggccttcag cattgatccc actccaagtt ccttgctctg tcttcccaca 22140

gctgtcccct tgggggatgt ggggggtctg acatcatttg cattattagt ctattccaag 22200

aaatgcacct gtgcactaat cagttcactt tttctgtctt agtcggcaga tctagccata 22260

gcccaatccc tcaatttcta tactaagcct tttatattag taaaactgtt atgttatcta 22320

gaaattcatc agtgggaaaa ctacttcaag ggaggtagtt agaggctgca aggtgctaaa 22380

tatttttctt tctttctttt taaatgtaac ttggatctaa agtaaggacg aatttccttt 22440

tattatttgt tcagaatata ccagctggtc ctgtgggcag aagtttgtta aggggcctgg 22500

atgtgaaata acagtgtatc tcgtgtctct gctcaagagc tcacatgtag ctacaaggca 22560

gagatttagg ggagtggcat atacggccaa ctgagaaata acaatattgt cagggactcc 22620

aaggcacttt ggaagatata aagaatttct taaattttct tgtagaattg ttgcaaaagg 22680

cagacatgct taaatgttta aataagcttc ttgaaaactc atggaacatt caatcacaac 22740

tccaacagtt ctccaaaatt tgatttattc tggccatatt atgcagcaaa gaaacacttg 22800

gctatttatc taaatctctt ctgtcttgta aatgatccta gaaaataatc tagaaataca 22860

ttttattaaa gtaatgcatg aggtacatat cgattaccag ccaatagttg aacttaaaca 22920

taatgcatgg gtgtgagggc tggcattgat gattcacaat gaacacagtt gaatatcact 22980

tccctgctga gactcgggta tcatcgcaaa accacagtga gcatcagtgg ggatctgcat 23040

gctctggtca agacagatct ccatgctgag tgtctgtttg ccatgatgaa gagaacagtc 23100

aacaggagtg tttgccatga tgtagagaac agtccgggag gagtgaatgg aggatggggg 23160

catgaggaaa gatgaggctt tctctagtta tgaccctttg tgtagaagtt aggagtaggg 23220

gataaatgtt tctgcctaat atttaacttg gaagagaaga tgtccatgtg aaaaactgct 23280

aaatactgaa acaagagagc atgtgactaa gcaataccat gtgtggcaca gaaaacaagt 23340

gcaatagcag tttagcaaag tgagttcagt gtaggctgaa ctggttagag caggtttccg 23400

ggtgaaggtg aggattggtg agggtttgga ttggtagaaa gagacgggga ggacatctca 23460

catcaagaag ttatgccagt ggatttcagg agaattgagt gtttgtgtct gaaaagcctg 23520

taagaatagg gcatgacagt gtggagaaat gcatgaaagt atgaaggatc gtgatatcca 23580

gtttgaggag tgctaactag aggctctgaa gatttgagaa gaaacataat gaaaggtgtt 23640

ctcagcctga tcttggtatg caggactggt aaaccccaaa caccttacca ttctattacc 23700

tctccctcaa ggaatgggtc ccttgataag aatttagtgt aaaaaagatt gtcaattcag 23760

tgctgctgct gagtgctagt ttctttaaac acacacagtt ttcttttgag aatttttttt 23820

ctattagata gacgaactgt tatttaaatg aaaaaggcac atagtcccat aaaacaatta 23880

cacattcggg tgataacttc aaaaggagaa attaaaatgt tcttatgttt tgagcaagca 23940

tttccacttc cagactttgc tgcataaaca tctgtggtca tctagggaat gcctgacctg 24000

gttcagaggt gtcagagcaa tgtaaagtca cggaagtgct gcagttctat tctgggctct 24060

catctttttg cagcggtcca ttctctaatt ttcaaccaca tattaccaga caatctctta 24120

agtcatacac aacaaactga ttctgtttca atgcttagaa ttagaataaa aaagcctaag 24180

caaaaatagc acaaacattt gaaaaacact ccttttttct accactccct tcttagaaca 24240

gaaataaaag ccctgtactt taagaaaatg gatggaagaa ttttctttgt acttcttatt 24300

ctccaagtta catttactac ctgatagtgt taataccttt ttgtagtacc tttctttaaa 24360

atatacaggg aaatgatctg ttccaagaaa ctgtgttttt aaatttaatt atagtgtgct 24420

atgatgattt aaaaaatggc cttttgagta aaggacacga acaagttatt taaaaagtga 24480

gcagtaagtg tggtcagtaa acacatcaaa aagttccctt cactaatatt caaagaaatg 24540

caaattagaa taataatacc cttgttgctt gtcaaattaa tactttaaca attattatgt 24600

aaattttatg gataggattg caaatcaaca cacctttcct ggccactggt gtacataata 24660

gaaattctaa aaatgttctt aggcttgacc aagcatttcc acttctagac tttgctgcac 24720

aaagatctgt ggtcatctag gagaaggctt gacctggttc agaggtatca gagcaatgca 24780

aagtcatgaa aatgctgcaa ttctatcctg gactgtcatc ttttttgtag tggtccattc 24840

tctaattttt caatgacgta gtaccagaca gtctcttaag tcaaatgtat ttgtagggct 24900

ctggatttga aattcaatct ggctttcagc cttgatgtgg ccactcccaa cttgtaaagg 24960

acctgtgaag acttagacac agaataaaac acagaagata agaaaaccaa ctttgaaaga 25020

aaatttattg tcaaaattgt actgggtcaa ttgagcaaaa acttcaaaga gcgttttcat 25080

attaaccaaa gcatccctcc tcaattgaaa catataaaga tattgttcac ccctatcctg 25140

actcagagat ccacaaatct gggcattcat catcaccata ttctgctggc aatagtttta 25200

agcagctaaa ttactgttct ctactcttga gtttcctcca tctcttcaga tacagaaagt 25260

tctagaatat attcaaataa tcaaatcttt aattcattcc atatatctgg ctcaagacag 25320

tgtcccaata accttattct agagaaagtc agatttagac ttgtgctcat catcatactc 25380

atgttcttga catcatttta agctctgagg agacatctca cataactctc attgatacgt 25440

gtatacatct gtcactctgt gtttgtgctg tgatggatgg acttggatgt agatatgcat 25500

agatgatgaa gcagatagct atatatatgg tattgatgta gattcagtac agctgtataa 25560

ttgcatctgt gtttcacata tcttgtgtac tgtatcttga ctgtatctgt gtcaatacct 25620

aattgagtta taaggcataa atatgtggag ctcttagcac aatacctggc acactgcaat 25680

cagtcgatgt atgtgtttgt gtgtgtgcgt gtgtgtgtgt gtgatacaga cagaacctgc 25740

taatatgcat aatagtcagg ttgggttgtt ataacaaaat actatagact gtgtggctta 25800

aacggcagac atttgtttct cacagttctg gagtctggga aatccaaggt caagattagt 25860

ttctggtgag agcagtcttc ctcttttgca gctccccatg gtttgcaaat cacagatttc 25920

tcgctgtatt ctcacatagt gtaggaggaa cagagggagg gaagggagga agtgcctaag 25980

gacactaatc ccatgatgag agttctatcc accatgacct aattacctcc taatgccacc 26040

atctccaaat actatcacac tgggaattag gtctttaaca tgtgaatcat ttggggtgga 26100

gaagacaaac attcagctca taacaggtaa ggtagaaaat ctcaagaatt tatattttgt 26160

atatgaaaga tcattaatga gcagaatttt aagtttaatg ccaattttaa tctattttta 26220

tcttttctac gattcttttt tactttttaa tttttaaact ttcatataca aagggataat 26280

atttggctaa atgttctctt ctttttgagc tctggatcat tgttacgatc accccataat 26340

tgtatgtgtg cagagatagt gctttataca tttttaaaac aattttatat acagtattaa 26400

attttatttt tcaataaaca atccatgaga tagaaagaac atatattttg ttttacagat 26460

aagctccagg gagagtctag ggtaccttag attgtatggg taaaacatgg tttatttaaa 26520

tcataaataa acagtcttat ttccctaaat gcacatacag gcatccacat caaatgaaat 26580

cacatcacat gaattgaaca ggcagttact gacttagaac tttgcactca caaaagacac 26640

actctcctaa atgtctccat catactatac tttttgtccc caaatgccta atcactgaag 26700

cttcagactt tgttgctttg attcccttag gaaaaattcc tggtgtttca gaaaaaaaga 26760

gccatttaac tacattagaa gttaaccctc ctttaaaaat gtg 26803

<210> 20

<211> 26803

<212> DNA

<213> Homo sapiens

<400> 20

cagttaaggt ggggcaggaa taaatcacaa tggtggaatg tcatcagtta aggcaggaac 60

tggccatttt cacttctttt gtgattcttc acttgcttca ggccatctgg atgtatatgt 120

gcaggtcaca gggcatacat tggcttagct tgggctcaga ggcctgacaa ggcacagaag 180

gagctgggat agaggtgcaa agtactcatg ctgacctgac atcccatgcc cacggcagac 240

atgactactt gatcggacaa tactttcttg gaatcaaaga cacaacttca cagtcctcag 300

catcatagtt caggcagcct gtatcagtag atcagagtgg gcacatggcc tggtgctatc 360

actccatcct gtgaggggag atgggattgg aatggaggtg gaggagtcac aggtggtcct 420

gatatcacag gcctgggagt ctgaaagaag tgcagtaggt agtattatgg ccctcaaaga 480

catctgtgtc ctactgtcta gagtcaatta aagtgttacc taacatagaa aaaaggattt 540

tgcaggtggg attaaactaa ggatctcaag atagaaagac tctcctggag tatccagttg 600

tgtccaatgt aagaacaagc gttctcaaaa tagggacaca ggagattgaa ttgcaaagga 660

gatgtgctga taaacggaga ggttggagtg atgccgccat gaggcaagga atgtgggtgg 720

cctctagcag ctagcaatga ttcggaaatg gattctcccc cagagtccag aaagatcaca 780

gcagtgctga caccttgatt tgagcccagt gtcacctctg tcagacttct gccctataga 840

actgtaagag gataaatttg tgttttaagg cacaaagttt atggtaattt gttatagcag 900

caatgggaaa ctaatacaag aagggttgtg ttatcaacag aaatacagca atcagaagaa 960

agatggttgg ggagagcaga gggtggggtg ggaaggtgat ggattctgtt tgggacattc 1020

tgggtgtcat atgaatatta ttggggaact gtccatcaaa agctcagact tcaaagaaag 1080

aaaggaagga gcaacaatat tttgaaaggg agaaagtagg taatattcaa tatgtgttga 1140

gtacctacaa ggtttttagt tctttcacca agttatttta tttaattttt atggcatcaa 1200

ggggtgtttt ttttttttct taaaccaaat tttctcagtt aagcatccca tgtaagtggc 1260

caggggttaa gagatgtgac taagactaga cagagtgatt ttcatcatta catggtacta 1320

tggttctact gaagcactga ggaaggaagt caagagagtt cctgagaaat gtctggagtc 1380

ttagtaacat gcaaagtgag gcagaggtat tgtcagtgtt agctggtcac tttgaaaggt 1440

tagaggtaaa taaagttcag ggcaatggta cttggagagg agtgaatctt tggtaacctg 1500

gaggagatgc ttctcagagg aaaatttctt cacagcatga agtcaccagc tctaagacta 1560

gtgggtgttc tgggggatgt tagcagtgac tcactgactg ttggcccagt gaggggaggg 1620

atgaaaggct gggtagtggg tagagaatct gactcctcct gcccccacat gtctattcct 1680

gggccttctc ttggtggggg caaaaggtat gcaaagggat ttccgcagtg tctgagtgct 1740

cccaggagac ggaaaagtaa ctgatgactt ggagttggag tcttgttggc tcaggcagct 1800

ggggcgtttt gggatttcaa cacctccctt tagtttctat gtatggtgct gagcaagtag 1860

tcaaagactt tggtcttgct ttaccccagt agcccacaag cctgagtaca tggctaacat 1920

ttattgggca cttagtgtgt gccaaagagc tttatgagac aggttctttt tgagtcccat 1980

tatactgata atgggactga taagaaacag aaggtcagaa aggcccagta acttgggcaa 2040

ggtcatgtag ctagtaagtg gtccagctga aatttaaaac caggtttatc caactccaaa 2100

tcccacatct gatttatttt gccatgaatt aaaacatagt tctgattttg agaaactccc 2160

agtcccagtg ggaaaacaga tggaatcaca aattaccata acacagtgta gtgatgtaga 2220

tataaaaaca aagacatggg aaccctgaaa ggaagttgta acaccaatag aggaatgcat 2280

ggaggagatc tttcagagga ggtagcctcg tagctgggct caggggtgga tgagtttctg 2340

gctagaagcg cattgtgggt agagggagaa catatataga aaggcatgaa gatggtggac 2400

atgtttggaa agagtgagta ctagactgat gaacacgatg agtcaggagc ttatgacgtc 2460

aggggctact gctagcctag ctaatgactg aagattctgt gaaaagaaaa ccctaacatt 2520

tccagctgag tactagggcc atggtgatta tatatcatct ctcatgacaa cacaaatgtt 2580

tgggcttact tatcatcctg ctcagtaatc attatgtcac tcattaaaga tgtatcaggg 2640

taaattttag gtgagaattg attagaaatg taaactctat atatgtagtt acaggcttca 2700

cagtttgcca ctcaaacaat atggtcatcc aatcatgagg cacaaccttc tgctcagaac 2760

ttttttataa ttgggagaaa gtgacatccg agttccatct cttctgagaa ctgtgcagct 2820

cagaaatctt cttccctttt ttgatccccc agttgggtga gatgacatta acagtgtgtt 2880

ataagcactt ttcatgttta ctaccccata ttcaaaatta agcatttcaa acaactgtat 2940

aattgtctat aaatgtagca ttattagtta attttccttt taacacattg aggttacctc 3000

taatgttttg ctatttttaa ctatgttgaa ataatcatgt ggtttttatt ctttgaatta 3060

ttttatattg taatgttccc tgaaatgaaa ttagttgatc aaaagatgag taatcttttc 3120

atgacttttg atacatgtca ctcaatcacc ttctggaaga gttggaacaa gagcctattg 3180

ctggcatccc atttcatagc catctcacca atgttggaaa atgggctttt cctattttct 3240

gctaattcat tagttgttaa tggcttattt taactattaa tcccttgtta ttgatgaaag 3300

ttaagcattt tctgtatttt tattttctgt ctaaattcta ctttttgcac aatttccttt 3360

gctcacttct tcactggaat ttagtatttt tctttccaat ttgtatgact ccaaaatcag 3420

tgataaaata agcaaagggt ctttcttaga ggctaaacaa gggaatgaat aaggaacaag 3480

aacagcaaag ggatagtgaa taaagataca aaataataac ttatttttat ttttgaagct 3540

ttccccaggc agtaattctt gaccttttta agattataaa ttattttgag atatgcattc 3600

ttatcctcaa aatgaattag tacataaaat ttaaatgggt tgatagatcc cctgaagtgt 3660

atccacaaaa tgctctcagg ttaagcaaca ttgttctata ataactgctt taaccaaaat 3720

gtttaattat tgcttgtgtt tacctgtcct agcaaagagc taattgttaa attttgtgtt 3780

agagggtcaa tattataaat aacttaatgt ggcctctctt tcctttcctt tttttgagag 3840

ttttgaggct atcactaagt gggctttaga gtaccaggtg ggaatctgac ctcactgctc 3900

aaactttcaa cttcaggcat gaagtggtcc cagtgatgtg ggaacctcag agtctaaaac 3960

aaaaatagta gactgaggcc ctcagaaacc agacttatca gattcagaat ttaatataac 4020

tatgtttgaa agatttaaag aaaataaatc aaattaaaaa gtgagcaaga agcaagaata 4080

acaaatgaac tggcatattt gagaaagaat tttgagcttt tagaaataat acatacactt 4140

attgaaataa aaactcaagt caataggttt aaacagcaaa atgaatatag ttaaagaaaa 4200

ctattgtgct gaaagattta aaaaactatt acacagaatg caaaatgatg aaatagggta 4260

atttaatata tggcagatat gttaagacac tatgaggata gtatgagaag acctgataga 4320

catctaatca cagcacctta aggtgaaaat agagagagtg caccaatatt gaggagttaa 4380

tgtctgagac tattccagaa ctgataaata gatgaatcta cagatctcag aaacacagct 4440

tttacaaagg ataaatgaag agaaattcac cagagataca ttgtaatgaa tctgtaaatc 4500

accaaagcta aagatattat ttcacaagtg gaatgacagc tgacttctca acaacaacga 4560

aagcaaggag acagttgaaa gacatcttga aaatggtgag agaaaaacta actgttaata 4620

taaaattgtg tacctatcaa aaatatcttt tggccaggcg tggtggctca cgcctataat 4680

cctagcactt tgggaagcca aggaacgtgg atcacttgag gtcaggagtt tgagaccgag 4740

accgtcctgg ccaacatggt gaaaccccat ctctactaaa aatacaaaaa aaaaaaaaaa 4800

atagccatgt gtggtggtgt gcacctgtaa tcccagctac ttgggaggct gaggcaggag 4860

aatcgcttga acccaggagg tagaggttgc agtgagctga gatcatgctg ctgcactcca 4920

gtctgggtga cagagtgaga ctgcctcaaa accaaaccaa accaaaccaa accaatcttt 4980

caagaagtac accataaaga catttccgga taaacagtga atgagattac ttcctaaacg 5040

aatatgtaag gatgtttctt tttaaaattt tttttgggtg tattcatcac ctcaagcatt 5100

tattcttttg tgttgttaca actgataaga atatctaagg atgtttcaaa aggaagaaaa 5160

atgatcccta aagtctggta tattagtttc ttattagttg ctctaagaaa ttactgcaaa 5220

cttagtggct ttaaaaaaca cgaaattatc tttcagttct gtaggtcaga aatttaacct 5280

cctgatttct ggtcagaagt cttactgggc taaaatcagg gtatcagcag ggctgctgga 5340

ggctctggag atgatgtttc tctaatttct agaggcattt gcattcctta gctagtggct 5400

tcttcccaca tcttcaaagc taacagtggc agtcgagtcc ttctcttatc tttttttttt 5460

ggggggggtt ataaattttt tttattatta ttatacttta agttttaggg tacatgtgca 5520

caacgtgcag gtttgttaca tatgtataca tgtgccacat tggtgtgctg cacccattaa 5580

ctcatcattt agcattaggt atatctccta atgctatccg tcccccctcc cccaccccac 5640

aacagtcccc agtgtgtgat gttccccttc ccttctctta tcttatcact ctgacctctt 5700

ctgcctcctt tctctacttt taaggaccct tgtgattaga ttgggtccac ctaaataatc 5760

caggataatc tctttatttt aaggttagct gattagcaac ctcaattcca tctgtaacct 5820

taatttcttt tttgccatgt aacctaacat agtcacaggc ccaagggaat aataggatgt 5880

gggaattgcg ggtggtggag taggggcatt attctgctta ccacagggga ccttggatgt 5940

cagtaaaaaa tggtgaggaa gaaaacagga aacgtagaat aatctaaaca aatctttgaa 6000

aaataagttg aaatgtgggg ttagaaaaag ggcagaacta aaatgttaag acaaattaaa 6060

atgttaagcc tataagttga gagggagatg atcaaggtta aaaatactca taaatcatat 6120

ttttttgggt agggggttag atatttatta attttagacc ctgagaagta aaatagtcat 6180

gacaaaaatt taatagtaac cactaaaaca agagaaacag agtatataac ttctaaatca 6240

atatgggaag gggaatggaa taagaaaaca atagcaacca ccaacacccc acccaaaata 6300

aataataagg tgagagagaa aaagaagcat tgaaaagggg ctaaaataaa ataaaaaatt 6360

aagtcatgcc cgtaatccca gcactttgag aggccaagat gggtggatca cctgaggtca 6420

ggagttcgag accagcctga ccaacatggg gaaaccccat ctctactaaa aattcaaaat 6480

tagctgggtg tgggggtgca tgcctgtaat cccagctact ctggaggctg aggcaggaga 6540

atcgcttgaa cccaggaggc agaggttgtg gtgagcagag attgtgccat tgcattccag 6600

cctgggcagc aagagcgaaa cgccatctaa aaaaaaaaaa aaaaaaatta agatagtaaa 6660

acaaatccaa atacattaaa gattacaaaa aatgaaaatg aactaaactt cctagttgaa 6720

agacatattg tcagattgga ttttaaaatc tggcaatgat atttccagga cacagtccta 6780

aaatattaaa cacagaaaag ttgaaagtaa agggatggaa gaacacagtc aaactaacta 6840

gaagagagct gggttcaccc ttttatatca gagcagaatt tcactgagaa aacactaaca 6900

ggaaggggga aaggcacaac atagtgatga agcacttaat tctcaacaaa tgtatgacac 6960

ttctaaacta ttatgactgc aaaaaaaaaa aaaacctcag catatataaa attttggaag 7020

agccatggct atcagctgac atgcacttac catatttgca ttgtcctact acaaacttta 7080

cccatatgac caaggtgctg tcttcatccc cattttacag atggggaaat ttccccatag 7140

agaaaaagat ttgggccatg ccttggtttc ttcttgactc tgcttcctgc tgattgatcc 7200

tcacacctca cctggagacc tacttcacat tatccatcag gatgagaact ggtgtgcctt 7260

taccaaagga ccacagtcac cttcaaaacg tgtttagata gatctggatg gagacttatg 7320

tggttgcaga tgaaaaaaaa gtccccatgg tatatctgac tccatgtcat tcactgcatg 7380

aacactcaca cacatgcaca cgtacacagg caaacacaat cctgttctgg tccggcagta 7440

gtgccaacac tcaaatccca ggtcctactc tgaagccttt gaggaaacca ttgtcattct 7500

ggggtttatg ggaatatttc ttcttggtgc cccttgttcc tcacagaagc tttttttctg 7560

tgctgtgggc ttgctatcct agctttccaa gctatcctag ttttgcaaat ttctctgatc 7620

aatcacatca ggttcttgga tcatcccaaa attaaagagg tacgttttgc tgcaagagac 7680

aaagacattc acctctcaca cagtttgaat tcctgggtag aaacagattt caatgctggc 7740

cagcctctgt agctcccagt gccccctcaa ttatgactcc cgaggcattg gagcaggatc 7800

ctcaccttgc gcaaagataa ttaggtgtgc tgaagaaagc cagacactgc tctttcttag 7860

ctctgcatcc ttaaaaagtt accactactc cttctctttg aatctttgac ttgtcaatgg 7920

taaagtgcct atgattctta aagggataaa aacgcaacct atataaagca cctggcatag 7980

tgcctggcac aggtgggtgt ttaacaaatg ttaactcctt tctatcccac tgtgggtgtc 8040

catatcctct tgggtaggct gcctctggtt tccattgtgt catcagagcc atactaaatc 8100

gatgtgttgg acatggatcc caagaactaa tttctggaat gagttatgcc taccaacttc 8160

cctgatactt acttctgtct ctccatttat caaatggaaa tgtttgcatt tggcctctgc 8220

cagttggagt aaccaaaagg cttagaggtt ttggagaggt cctacactgc catctgtttg 8280

accacatact gcctttcacg tgtaataagc attgtttctt acatttgtct aggaattagc 8340

agttcacaaa gcacattcgc atataagggc ttgttttgaa ttgatcttgg cagcaattct 8400

atgagacaag taaaaggtag gtcaagcatt ataatcctca ttttaaatct gggaaaactg 8460

aatctcaaaa aggttgaaag acttgtctag gggacagtgt gtgggtaaat gagaagttaa 8520

gatttgctga actggcattt cctgactaca tatctagtgt ttatttatgg agaaggcact 8580

acggtggcca agtggctcag agtcacacag ctctgtgcct cagtttattt gtctgtaaaa 8640

tgaagataat aatatattct gaatactgtt gtggaatttc attgagatag ttcacataat 8700

ggcatggata ctgtagtaca ccgcctagat tcacaacccc acgactatcc atgagaatgg 8760

cccatagctc aagaggtcac attctttccc caggtgaagc ccgcatccaa tgactgctca 8820

gtgtgggtat ataaaggcct ggctcccttg ccagtgccac cctacctcct ggcgaatgga 8880

ctgaggcttg cattatgact gcattgcagc tcaactgttc tttccattca gtctttcctt 8940

tacactcaca caggtgagga cccagccatt aaatgcctca catgatgacc tctattgcat 9000

gctaggcttc gtgtgcacac acaaaaacca tcctctatca gtcaggcccc ttacttgcag 9060

aggcaaagag gccagtctgg gttagatgtg caccctgttt ttacaacaga acgagacaaa 9120

caggtcctcc ttaggtgtaa gttcatggcc ttggccccac ccctgaaact cagccatctg 9180

agacagtttt aggactgagg caaccccaga ctttgggttg ttgtttgctg ggcacagcct 9240

ccttttgcca atgttgcaat cctttgtaag agaccacagg ttgatcaccc gttcctgtta 9300

ctgagcacag agaggtttgt aggccagtct ctccaggaat tctgacgcac tgcaaaatcc 9360

catggtctga atgcttctac cttccctgtg aaagcccctg gcctcagaaa aggaagctgg 9420

tttaagtgac caacatttgg ggtggagctt ccgagggccc agccaccgtg ttacatgcaa 9480

caatcaacag agatattctt tggctagagt tgtttttctg ggtataggac cctataatta 9540

aaatcagctc tccaacttcc cttcctccaa aaagtataca atgtaaggag gaaaatgcaa 9600

attgaaaagt tgctagccct tcccgccaga atgccacccc aagcctcccc tgcaggaagt 9660

tctggagtcc ccaactctgc cccaagcctg aggcccttga taaggtaaag ggatgtgagt 9720

gtggaggccg gagcccccct cgccctgtag gctgctcccc ttgcttttcc ctttgaatgt 9780

tacagtttag ttctgtgact tacttataat tgcctgaatt ccccgcccac gctttctctt 9840

actttggggc ttctcaccgt tcctcttcct ccatcttcct cctctgaccc cactcccaag 9900

cctgaatggg gtgttcctct tccgtgctcc cacaaaaccc tgtgcctctt tcatcgttgc 9960

atatattatg ctgtaatgta gttttctgga ggtgtgaaga ctatgaatcc tatgaagaca 10020

aatacacacc taccttgctg accgttgtat cctcagaatc taatactgca cttggcacac 10080

agtggttggg agtaaatatt catgaggcaa acacacagga aggactcttt tgttatggtt 10140

gtttgttgtt gttgcaagta acataacccc accttgatct agctgactga cggctctacc 10200

accttgtctt ttgcagcaca agaggaatag gaactgcacc tcttccttca gtttcagctt 10260

gaataatatc aggaagattc gtatcggtct gagttgggtc acgtacccga cgtgctatag 10320

ctgaggatgg ggtaagctga ttggagtttg caacactgtt cacatagcca agatatggaa 10380

agaacctaaa tgtcaactgg tggatgaatg gataaagaaa ttgtggtata tacatacact 10440

ggaatattat tcaaccttaa aaagaaggaa atcctaacat ttgtgacaac atggatggac 10500

ctggagggaa ttatgctgag tgaaataaga cagacacaaa aagacatttc ttgcaggagc 10560

tcacttatat gtggaatcta aaatagtcaa gcttaaagaa gagagtagac tactggttgt 10620

caggagcagg agaaaagtgg aaatgaagag gtgatagtta aagggtacaa agtttcagtt 10680

atacaagata aataagttct ggaggtttac tattaatata tcacatagta cctataagta 10740

acaatactgt attgtatact taaaattgct aagagggtat atcttatatg ttcttaccaa 10800

taataataat aatggtaata attaaggggc aggaggacac ttcaaaaggt gatggatatg 10860

tttatggcct tgatggtggt gatggtttca tgagagtata cttatcccca aactaattga 10920

gatgtaaata ttaaatatgt acagcttttt gtatgtcaat cgtacctcag taaagtagtt 10980

taaaaatggt tggactgaga aaaggaggag ctgctcagca acatgaggct gggtgctggg 11040

cagacaaaac ctcacacatg cattactgaa cccacggact catgtctgtg agctttgtgg 11100

ctgtggatgc accatgccaa tgtagtcaag gattcttcaa tgtgtacctt actggattag 11160

ttccctctgt ttatttgtat tgactcctca gttcccttat gggttgcttg ttggctcttg 11220

tggaattatt taagtaaggc tttggttgca ggagtcagac atgcttaagc tggttttggc 11280

tgtaatgggg aatttgtgag atgtgacaca gtgacaggaa gtgcagccag acgttgtgag 11340

aggcagtaac tgggaatagg aaagttatga gaagttaagg cagtagtaat tgtttctcta 11400

tcgaaggcca taatgttatc attcctgcct ctatctgttt gcttgttctt ctctctcagc 11460

agaatggtct tctctgcttc tctgtgcacc tgcagaaggt gaccacccta aggcttatgg 11520

attcaggagt cctcagtttg agagcagtta ccaaatgcct cgcccctgtg aactctagtc 11580

ccagtttctt attcctggta ctggcttagt ttgaggcagc tgcccaccgt aagtccagtg 11640

agccatggcc tggggacaag gtcaggtaca tgtgtaatca gctgggtcta tgagttgtgg 11700

tggtggcgat ggaggtagct cccagaaaaa tggattacag gttaagaaga gtctatatat 11760

cttgaccaca tttgatgtga cttggaagtt tcaatgtgtg accacttaca aagttatgat 11820

caggtgtctc atttatttat ggtgatgtat gagtccgtgt gtgagtgtgt gtgtgtctgt 11880

gtttgtgtgt gtgtgtgaga gagagagaga gaatgagaat atgagtggtg gtttcccatt 11940

tatttttcta tgggccaaat cctgggctat gagctggaga tataagagta aacaaaatag 12000

acacggtgct tgctgtgacc tgccctggga gacagatatt acacggagga tcacataaat 12060

gcagagtctg agctgaggtc ttaagggtga ggataagtaa ctagtcagtg gagcagggga 12120

gggaagggtg ttccatgcct gtgtcaaggt cctgaggtga gagaaagagg tgaatttgag 12180

gaaccaaaag gagttcaggg aacaagaggg gctgtttcac aagctgagtc tggaagctga 12240

gcaggctgag cagattctta ggaactctgc aaaaacttaa gggcttgtct atgaccgtaa 12300

acaactacgg tcgtagataa acaagttggc aaacaactca aggatttaca gtcatcagaa 12360

ttgtaaaact gatcccatgt attttcaaac ctcaaatccc ttgctctgac cttgtgtgtc 12420

taagctagaa ggaagcagga tgcacctctc ccctggctgg aatgaaggga ttcacccaag 12480

ctctcagtct tctcacggca tccagggccc ccctgcttgt gtgtggtcta gatttccatt 12540

cccatagtag gaattccttt gggagccttg gggtctctcc tgctagaggg cttcacctgt 12600

gactgtctca attcaaggga ggggttctaa taacattaaa cctcaatatc ttgctcttcc 12660

attcctgatg cctccctttc cttctaccct tcccctacct ccttctttcc tatgccacag 12720

gctggcaggt tagtgccaga gcaagtggcc agtcaccatc attggggttg tggatcctca 12780

gggttcttca gaagcccctt caccatgatc aagagtctcc agtcactcag aattccacgg 12840

ttcccaaatg ccagctctcc cactactccc agcgttctcc atctctggga tgttgggctc 12900

caggcttctc agatgcactg agtaccctag gctaagccac tgatccatca gaacttcata 12960

gcctgagagg agagggagac aggcttgcaa aggagagttc tgactagaca ctggggtgct 13020

acagatgccc gtaagttgtc cctttaccct cgatgtcccc agtgttggga ccacctggga 13080

atgcccagcc ttgtgtgctg attgacttgt agtcccctgg ccctgactgg aagcctagtt 13140

ttctctctca tgaccagcta ggcccctagc tccccaggga agaaatccaa tctatttcct 13200

ctgatagtaa tggctaatac ttaaataatg ccaaccacat gccaagcact ttacagttgt 13260

tagcccagtc ttcacaagca ccttgtgagg tgggcaagag tcttatctta ctctcatttt 13320

atagatgtgg cccaggatcc cacagctata gttcatggtg ctgggatttg aacctctggc 13380

caccagagcc caccttaatg tgtcctcctc ctgttgtcat aacagaaaag tacaacacca 13440

tgatgacaca tcaggctatc ctggcaggtt cccaggctgc cccaatgccc aactttctag 13500

gtttacaaag ttgacattta cgaagtttcc aggtttacaa atctagtttc tgattcttta 13560

gtcagcagga atttctctac aaaagctgct tcgaaaattt ccagccaaac cttacacacc 13620

ttggcattac atcttggtga gccaaggcgg aagagaacag gaagtgaagg ccccatggga 13680

agtccctgcg gtcgggagca cccaggcggg gcggggggtg gggggctttc ctgtggccgg 13740

ctccctgccc ctcccacccc cattcaggcc ctgtgagttg aatgaagaga ccctgggaat 13800

gagtccaggt ctgcagggtt agaggaaatt gaaggccctt accagatccc tgttgagaag 13860

tttatgaatt atgagccctt ctgcaaatga gagggttctt ccctgtcagg agggacagat 13920

tgtaggtggc aagattggtg gcagccagta ggctggtctg ctccttcctc tctatttcat 13980

atgtgtatga aggcattacc tgcagcaagg gcctgtgtaa atgcatgtga tttacagagc 14040

attttatgta ctgcgtgtca ttcatgcttc cggtgagccc taagtctaag atagggcaga 14100

tagcatcagg tccattttgc agctgtcaaa atgaggtctg aagggcagaa gtggtgtgcc 14160

cacacacaca caactggttg gctgcagacc tggggactag acccgggact tcgtcctgcc 14220

caggggtctc ttgccactgc tccccatcaa cttggatggc tttaagcatt tgtgagttgt 14280

ctgctccctg atggcagaat gcagagacat gaagctacaa gcaggttcgc tcccaacggc 14340

aaaaaggagg aggggtgttc agaacatcag gtgcttctag agaaagcagg gagagagtat 14400

ctggccttgt ggacaatgtc acggcagagg ccaggtatag ggcatggggg taactggaag 14460

cgggatggac cctgttattc cctaagacat ggcttccacg tagtgctcaa acaaggcctt 14520

tgcccttgct gttccctcca cctggaatat tcttcccctt ccttgacatt gctcaggtct 14580

ccactcttat gtcaccctct cagagagggc ttccctggcc actttcccta aaatagccac 14640

ccactcctag gtccctcaaa agcatatcct gctttggatt ttccctatag caatatgccc 14700

tatgaagtta ttttatttgc taacttgttt cttgtctgtt ttcctttgtt agagcgttgg 14760

ggaccttgtc tggcttgttc ccaatgcctg gaagagtgcc tggcacacag gattaagcca 14820

acacatatgt tttgaatgaa tgtgtgcaca catgcatgag ctggcggcag tcggggttgg 14880

ggtaagcacg aaggcccagc tcagttctct gcatgtgacc tcccatctta cgcagataag 14940

aaccagtttg gtttctgcta gcctgagtca ccctcctgga aactgggcct gcttggcatc 15000

aagtcagcca tcagccggcc catctcctca tgctggccaa ccctctgtga gtgtgtggga 15060

ggggaggctg ggctcctcct tgtactctct gaggtgctct ggaaggaggg gcagctccac 15120

cctgggaggg actgtggccc aggtactgcc cgggtgctac tttatgggca gcagctcagt 15180

tgagttagag tctggaagac ctcagaagac ctcctgtcct atgaggccct ccccatggct 15240

ttaggtaagc tccttccact ctcatttttt cacctgagaa atgagagagg aaaatgtcta 15300

caattggtgt ttatcaaatg ctttcaggct ctggtgagca agcgtccagg aaaatgtcaa 15360

gcgcatggag ctccaggcct gtctggggga tctgggcacg gggaggcatc catgggagac 15420

catgcaggca ctctgaggca ggggctgcaa gcctagtgcc tgctggggca gcaggtgaac 15480

agagaggtgt aactgctgtg acagaagtca tggagtcctt ggagtgtgag ggtcattttc 15540

cactgttgat agaataggga aattggtgaa atagccctgt taaatgagag aaagaacagt 15600

gtgagctcaa tgagaaatac taatagaatg tggcactgag ccacaaggtc tgaggcttga 15660

ttgataagga agggtgggga ctgtggagaa ttaagggctt ggcacaggtc agttccacca 15720

gttgtcacaa gagaatgcag gctcaggtgg ccagaacttc tcgcttttcc agaagagtcc 15780

gatattctga tttcattata tatagtattc tgattaaacc agacaataaa gcaagcagat 15840

aaaatattta aagtataagc tgccagtttg caacctccgg ttaggatttg tgtggggcaa 15900

agaaaaaaac tctcaggatc attggtatgt agactctaat tttaagtttc taatttaaaa 15960

ttggcccctg aggctgggcg tggtggctca cacctgtaat cccagcattt tgggaggcca 16020

aggtgggtgg atctcttgag gtcaagagtt caaggcctgc ctggccaaca tggtgaaacc 16080

ctgtctctat taaaaataca aaaattagct gggcatggtg gtgcatgtct gcaatcttag 16140

ctacttgggt agctaaggca ggagaattgc tggaacccgg gaggtagagg ttgcagtgaa 16200

tggagatcac accactgcac tccagtctgg gcaatagaga gagacgctct ctctaaaaaa 16260

aaatatgtaa agataaataa aatgaaataa aataggcctc taatgagcag gccattctcc 16320

tttctgggtc ttactttcct tgcactcctt tctgggtgtt aagaggaggt ctagaggaag 16380

ctggacaact cttagcttgt agtaagcaca gtggaagtat cagctcttaa tgggtcatgg 16440

acacgttaca agctaggcgc cgtgctgagc actttacatg gtttatccca ctgaaccctc 16500

tcaataaccc tatgaggaag ggctattatt gctcacattt tcagaagagg aaatggatat 16560

agagagatta gataatttgc ccatggccag acagctagta taagaggagg aggtggattg 16620

actgcagaca ttctgtcttc aaaccactac actatgctat ggaggcacag agacttaatg 16680

aaatcatgga gaggggaatt gctttgtcaa ccacaagcag ttattccggg ggcagcagat 16740

cctcccctgt cccccagtgg gtacaatggt ccctggtggg ttgtgctaca atgttagccc 16800

atggtcttat gtgtttttca aatgtgtaaa gtaggatgct ggaaccactc ttagaaccag 16860

ataccaatac attgtgaaga aataaatctc tgtgcttaaa actggttcat cccaaaatat 16920

tttgaactga cacacaatag gtgctaaata aatgtgtgtt aacttgaatt ggattgaatt 16980

cgggaaaaaa gtgcaataag cttagtgaag acaccatgtt ccctgggtag aggaaccaca 17040

ttctccatct aaggccagga gtatgggagg tatcaatgtt tgcccagcac agaacagggt 17100

gccaagaaga gaaaagttga cggggtgcat actctgactg gaaactggaa gggtgagaac 17160

agagggtaaa ggatagagat ggaaccatgt gcatacactt tgtgttacct tggacaagtc 17220

attcatttct ctggacctct gctttctctc tacacaatgg ggtcccacca cttcccttac 17280

agctgacttg tatgaagaag gaggtggagg aggaggagaa ggtgaagaca atgctgactc 17340

aaagggtaaa ttatttttag gatccaagtt tgaaaacaat tttaggctac tagatatgaa 17400

caacatcttg attatgtagt tgaaggaaat taaagatgaa tggtttaatt aaaaattaat 17460

cagaatgaaa acgattgatt actaatatat ctgcaatggt ttattttcct gagtggcaga 17520

ctcactaagg tttttgaata ctcctgtgtg attgctctat gtatgtatgt atgtatgtat 17580

gtatgcatgt atctatctat ctgttgtcta ataaaatgga tcacatctct gctaataaaa 17640

acactacact ggcagggtac aattataatc attaactgtg cctggaattt gcagcagcag 17700

ccaccagagg taccagtgcc ctttaagggt tcataattta gaataatcca attatctgag 17760

tttttcaggg actgaggggt ttggcaaggt gtagaacttt cagtaataaa gtcaagaaag 17820

tcctggacaa accaaggtag ttggtcactc tagtccataa ccaggtaaag agctttccct 17880

gtaacctgtg taaggtttta gaatcatttc tttccttatt accaaaaatc ctccccaaat 17940

tttcaagaaa ttatgaacta aatagttact ctatgagata ggagttcagc ccaaaagaaa 18000

caccataaga acaaatataa ttcttgctta tgttaaccat gcaatgaagc agagagaaaa 18060

agtcagtggc ctctttagga ggactgtagt gtgggaagaa ataactaaac tgggtttcaa 18120

tcctggcctg gccaggatct ggagcaagtg agttaatctt tctaagcctt gagtagtttc 18180

ttcttcttct tcttcttctt cctccccctt ctcctcttct tcttcctcct ccttctcctc 18240

ttcttcttct tcttcttctt cctcttcttc ttcttcctcc tcctcctcct cctcttcttc 18300

ttcttcctct tcctcttcct cttcctcttc ttcctcttcc tcttattctt cttcgtcgtc 18360

ttcgtcttct ttttattttc aaagtgaaag caagtttatt aagaaagtaa aggaataaaa 18420

gaatggccac tccatagaca gagtagcctg aaccttgagt tcttctataa agtcactatg 18480

aatttatact cattttgaaa gtgggtgtca atatgtctgt ccactttgca cagctgttat 18540

gtggacaaaa ggagatctgt gtgaaagtgt aacacagagc ctaaactata acaggtaagc 18600

aacacagttg tccccttccc catggtgtct gttcttctcc atttcctcct gtctgcaggg 18660

ggattataaa actaatcatc aaagccaaga aggcaagagc aagcatgtac cgctgaaaac 18720

acaagataac tgcataagta atgactttca gtgcagattc atagctaacc cataaactgc 18780

tggggcaaaa atcatcttgg aaggctctga acctcagaaa ggattcacag taagttaacc 18840

atgtagatct gagaggagag tagcttcttg tagataacag ttggattata taccatgtcc 18900

tgatcccctt catcatccag gagagcagag gtggtcaccc tgatagcagc aagcctgggg 18960

gctgcagctt ggtgggtaga ggtactcagg ggtacagatg tctccaaacc tgtcctgctg 19020

ccttagggag cttctaataa gttgatggat ttggttaaaa ttaacttggc tacttggcag 19080

gactgggtca gtgaggacca acaaaaagaa gacatcagat tataccctgg gggtttgtat 19140

ttcttgtgtt tctttctctt ctttgtacta aaatatttac ccatgactgg gaaagagcaa 19200

ctggagtctt tgtagcatta tcttagcaaa aatttacaaa gtttggaaaa caatattgcc 19260

catattgtgt ggtgtgtcct gtgacactca ggattcaagt gttggccgaa gccactaaat 19320

gtgagatgaa gccattacaa ggcagtgtgc acatctgtcc acccaagctg gatgccaaca 19380

tttcacaaat agtgcttgcg tgacacaaat gcagttccag gaggcccaaa tgaaaatgtt 19440

tgtactgaaa tttgttaaag cttcccgaca aactagattt atcagtaagg attgttttct 19500

gcaaggggga tgaaacttgt ggggtgagcc atttgggctg aggaggaggg aggttggagc 19560

tgagaaatgt ggagacaatt tccctttaga aggactgaat ctccctgcct ctctggggtg 19620

cggcagccag caggatccaa tggtgtatat gtctccccag ctccccattc agtgatatca 19680

tgtcagtagc ttgaaattat ccgtggtggg agtattatgt catggaaatt ggcaaatgga 19740

aacttttatt ggagattcaa ttgttaaact tttaccagca caacactgcc ctgccttcag 19800

agtcaatgac cctatccaag tttaatccat ctgtccactg tctccaacac gatctttata 19860

aaacacacct gacaacatta cccttttatt cagtttttta aaagataagt ttccagctca 19920

tcggggtggc tttaaaggcc atttctcctc tggacctcac ccaacttttc aaatcacttt 19980

tcctacccct acctctaaat gctactcaaa ctccagccat cctgaataat aagacttttg 20040

aaaagtagat tatgggctgg gcacagtggc tcacacctgt aatcccagca ctttgggagg 20100

ccaagatggg tggatcacct gaggtcggga gttcgagacc agcctgacta acatagtgaa 20160

accctgtctc tactaaaaat acaaaattag ttgggggtgg tggcacaagc ctgtaatccc 20220

agctactcag gaggttgagg caggggaatt gcttgaacct gggaggcgga ggttgcggtg 20280

agcctagatt gctccactgc actccagcct gggcaacaag agcgaaactc catctcaaaa 20340

aaataaataa ataaataaag tagattacat cagatacctc tggcctaggt tgtttatgac 20400

caactctcct gctgagaata actagaaaag ctagacaaaa catatttcca aaagatctct 20460

ttggaggcat cagagaatgg ccaaggctgt aaggaactgc ctgagcccag agaggtggag 20520

cccagcactg gtgcccttta ctcctgggga catgtgctgg tttcaaaaac ttcagctgag 20580

cttttgagca ttcatggaac ttggtggggg agatgaaatt tgtaccttaa atcctgccta 20640

cagggagggt ccctgataat ccccacccaa tttggaaatc tgggtcagcc ttcacaggta 20700

ctgaagccct cctctgaatg atctcaagtc ctgctagggt agaggttacc tgcttttgaa 20760

aggctcctgg cctacctgtg cagcaggagc aaaagtgaac catctcaggg tacagataac 20820

aatcatccag agccttgaat gacctctact gtgcttaata tatagtattc agcagtcagt 20880

aaaaaggatt taggcacatg caagatgacc tgtgtatcag ggagaaatag gcaataaatt 20940

gagatccagc agggatttga atcatggatt tgaatcaggg gcagccttcg aaagaactat 21000

ggagaatata ctcagattta aaacataaga ttggaatttt tggcagagaa ctaacaactg 21060

tacaaaaaag gaaccaaatg gaaatcctag aactgaaaga tgcaattaac cgatgttgag 21120

aaatagccaa catctattga acacttccca tgtggacagc tgtgctaaac actttacagg 21180

catcaacata agatgtgtcc ccttacagca gtgcagtgtc cctcctaaga catggacagc 21240

ctggtttccc tatctctctg cttcatcaaa acccctttac gtggggctta gacactcctg 21300

ttgtctctag tgtctagtag cacagggctc agcacatgga agccactaga tacaatttga 21360

tgaccaggac ctccgatgaa agccatgggt gctgattggg aaggcattgt cttttatgtg 21420

ctatggtctt aaagcttcat ccaggaagca gaactcgggg ggtgctgagg acccagaacc 21480

gagaataaga ttagtcagag atttcctgtg ggcagaaatc ataaggacgc caactgtttg 21540

ggtgagataa gacgaaacca agagtggact tgtggccaga agcgtgagga agagggagag 21600

agcttccctt gtcccctttc ttcctctccc taagccacag tgattgacag ccccccccct 21660

ttggagtcag agcaggcttg agactggact gggaaaggag ggtgggtcag gatacagagc 21720

aggaaggctg ggagtgcagg gcaggagcaa ggggctgggg cattcattgt gcctgatctc 21780

tcccacttta cctggggtaa agaagcatat gcaaaagcca cggtgtgagt atttcccaag 21840

tgccagggtc agggcatgat tcatcacgtg cagcatttca ttcaatcctt atagtaaccg 21900

atgatgtggc ttctattatt agctctatca gataatgaaa ctgagaccaa gacaggctct 21960

gcacattgtg tggggtaatg acacaggggg attcagacct agactccata actcctgccc 22020

cagggaccac ccccaccctc accctgtgca tgtcgacaaa ggacagactg ggccacttct 22080

caggacacag cggggaaatg acacagagca gggaggttcc aggagccccg agcgtctttt 22140

ctccaggaga atactctctg aattcagact ggggtcagag aaacatttac ccaggagccg 22200

cagtgtgggt ggggcttttt acttgaaacg ctgtctgaag gcagtggcca ggatggaact 22260

ctccacccta ccttggcaag ccacttctct tctgcaatct gtaaggacat tgttgagaga 22320

attatggtct tccaattccg gagggttgaa gaaagacaaa taggagagaa cctatcatag 22380

tcaggtgcta gctgccttct ctttcagaga gtgtgagaat aaagtgatac acttgattat 22440

tagcaaatac tttggaaatt ttaaacgcta atattcaaca cactctggaa gaggcaaata 22500

agtagacagg ttcatataca tcatctcctt cagctagtcc tcacaaaaac aaacaaatga 22560

ataaacaaaa ttcttctttg gccctcatag gaagacactg tttcttgaac gtgtttcaaa 22620

aaggatgggt gactcactca aggtcacact gtttatgagg acagtacagg aatacagaca 22680

tgccattttg cctgaaaaaa tccatcaccc agggaggtga cacaattttg cagaaatgtt 22740

ctatttcctc tgaaggatac attctttaaa cctttgggaa attcattcat agtcttcctc 22800

ctttgaagga ttaactctct ggacacaaag tgtttgattc tgatttgttg gttggaagat 22860

gtgttggttg agagaaagat tctgatttgt tggttgaaaa tagactcatc aagatcaact 22920

gctgtagtag taaatatttt gacattttgt ctgtattcct gtgctgccct cacaagctgc 22980

atcaccttga gtgagtcatt catacttttt tgtttgtttt tgttttggag atggagtctt 23040

actctgttgc ctaggctgga gtgcggtggc gtgatcttgg ctcactgcga cctccatctc 23100

ctgggttcaa gtgatcctcc tgcctcagcc tcccgagtag ctgggattac aggcacatgc 23160

caccatccct gctaattttt gcattttcag tagagacgga gtttcaccat gttggtcagg 23220

ttggtcttga actcctgacc tcaggtgatc cgcccacctc agcctcccca agtgctggga 23280

ttacaggtgt gagccaccgt gcccagccca gccatcattt ttgaaacacg tttgagaaac 23340

agtgtcttcc tttgagggcc aaggagacat tttttttgtt tatttgtttg tttttgtgag 23400

gactagctga agggggtgat gtatattaac ctgcctactt atttgcctct tcccagagtg 23460

tgatgaatat tagggtttaa agtttctgaa gcatttgtta ataaagcccg gggctggagg 23520

tcagaagacc tggatttctc tgcatacttt tgccatcagc aagctgtgtg accttggaca 23580

gatccctttt ttgtctaaat ctttctgagt cttcttgaaa acaatgccag gttgggacag 23640

gatgattgcc aagctcccgt ccagctctaa aacactgcaa cgtatgcttc tgcaccagca 23700

ctgtccatcc tgtagatcat gcagaaattc tcttcaactt tttcctaccc ataaaatagg 23760

agcatgctta cctttttcct aatgttccag gccccgggtc tagaatattg taagtaagga 23820

agttaatgtg tatcagagcc cattatgggc cagaagttct cctcttcctt cctacacctg 23880

cttcctccct ccctccctcc ctctttccct tccttccttc catccatttg tgaagaagac 23940

atgatcaccc tcattctgag agtgaagaga cagaggctca actaatgaaa tgatttgttc 24000

aaggtcacac gggtggcaca aggcaagtgg cagaggttga atttagaccc attcctgtcc 24060

aaatgctgag tttatgtcat cgtcccgaga ccataacttt aaagatgtaa gatagtggga 24120

aaagagttga tttcaaagca cctctcagaa ggactcactt tacatcaggg gtcagcagac 24180

tcaggccaaa tccggtccat tccccgcttt tgcaaagaaa gttgtagtgg aacacagcta 24240

ggcttattga tttatggatt gccaacgtcc ttttgtgaaa cagacagctg agctgagtaa 24300

tcgtggcgca caaaacctaa aatatttact atctcgtcct ttacagaatg tttgccaatc 24360

tatggtccgg agtccaaggc tgtccatttt tcaaagaaca caaagtgaca tgagactgtc 24420

ccatgtgcag ggagccctat cattttatta tgaaaaaacg gcctttctgc tcaaatctgt 24480

tttttaaaaa gtcaacaaac agactctggg tacctgtcag gaacagtagg gagtttggtt 24540

tccattgtgc tcttcttccc aggaactcaa tgaaggggaa atagaaatct taattttggg 24600

gaaattgcac aggggaaaaa ggggagggaa tcagttacaa cactccattg cgacacttag 24660

tggggttgaa agtgacaaca gcaagggttt ctctttttgg aaatgcgagg agggtatttc 24720

cgcttctcgc agtggggcag ggtggcagac gcctagcttg ggtgagtgac tatttcttta 24780

taaaccacaa ctctgggccc gcaatggcag tccactgcct tgctgcagtc acagaatgga 24840

aatctgcaga ggcctccgca gtcacctaat cactctcctc ctcttcctgt tccattcaga 24900

gacgatctgc cgaccctctg ggagaaaatc cagcaagatg caagccttca ggtaaggcta 24960

ccccaaggag gagaaggtga gggtggatca gctggagact ggaaacatat cacagctgcc 25020

aggggctgcc aggccccaga gggcctgaga actgggtttg ggctggagag gatgtccatt 25080

attcaagaaa gaggctgtta catgcatggg cttcaggact tgtgtttcaa aatatcccag 25140

atgtggatag tgcgaccgga gggctgtctt actttcccag agactcagga acccagtgag 25200

taatagatgc atgccaagga gtgggactgc gattcaggcc tagttgaatg tgctgacaga 25260

gaagcagaga ggggcaccag gggcacagcc cgaaggccca gactgatatg ggcaaggcct 25320

gtctgtgctg acatgtcgga gggtcccact ctccagggac cttggtttcc ccgtctgtga 25380

catctgtgac atgagagtca cgataactcc ttgtgtgcct tacagggttg ttgtgaaaat 25440

taaatgcaca gataatagcg taacagtatt ccgtgcattg taaagagcct gaaaaccatt 25500

atgatttgaa aatggaatcg gctttgtgag accatcacta ttgtaaagat gtgatgctga 25560

tagaaatgac aggactgctt gtgcatgccc tctgcagtgt gacattccag cagtgaaatc 25620

atgttggggt gacttctccc ccactctgac ctttatgttt gtctgggccg aggctgcaag 25680

tcgggctctg tgggtgtatg agtgacaagt ctctcccttc cagatatggg gactgtctgc 25740

ttccctaggt tgcctctccc tgctctgatc agctagaagc tccaggagat cctcctggag 25800

gccccagcag gtgatgttta tccctccaga ctgaggctaa atctagaaac taggataatc 25860

acaaacaggc caatgctgcc atatgcaaag cactttggtt tgcctggcca cccctcgtcg 25920

agcatgtggg ctcttcagag ccacctgatg aggtgggtac agttagccac acttcacagg 25980

tgaagaggtg aggcacaggt cccaggtcag gctggccgga gctctgttta ttacgtctca 26040

cagctttgag tcctgctctc aaccagagag gccctttacc aagaagaaag gattgggacc 26100

cagaatcagg tcactggctg aggtagagag gaagccgggt tgttcccaag ggtagctgct 26160

cctgcaggac tctgagcagg tcaccagcta atggaggaaa ggctctaggg aaagaccctt 26220

ctggtctcag actcagagcg agttagctgc aaggtgttcc gtctcttgaa acttctacct 26280

aggtgctatg gtagccacta gtctcaggtg gctatttaaa tttatactta aatgaatgaa 26340

aatagaagaa aatttaaaat ccagaccctt ggtcacacta tccacattta aagaggtcaa 26400

tagccacatg tggttagtgg ccaccctatt gggcagtgca gctacagaac atttttgcat 26460

cccagaaagt tcttttggat gttgctgctc tacagcatgc tttgctgaaa cagaagtgcc 26520

ttccctggga atctcagatg ggaagcaagt aaggagggga gtcaaatgtg ggctcactgc 26580

tcaccagctg tgagggttgg gcctgcctct taaccattgt cagcctcagt cttctcatcc 26640

atgcatgccg tgggtatact aaaatactat acccctggaa gagctggatg caaatttgac 26700

aagttctggg ggacacagga aggtgccaag cacaaggctg ggcacatggt ggctgtgcac 26760

tacagctgag tccttttcct tttcagaatc tgggatgtta acc 26803

<210> 21

<211> 177

<212> PRT

<213> Homo sapiens

<400> 21

Met Glu Ile Cys Arg Gly Leu Arg Ser His Leu Ile Thr Leu Leu Leu

1 5 10 15

Phe Leu Phe His Ser Glu Thr Ile Cys Arg Pro Ser Gly Arg Lys Ser

20 25 30

Ser Lys Met Gln Ala Phe Arg Ile Trp Asp Val Asn Gln Lys Thr Phe

35 40 45

Tyr Leu Arg Asn Asn Gln Leu Val Ala Gly Tyr Leu Gln Gly Pro Asn

50 55 60

Val Asn Leu Glu Glu Lys Ile Asp Val Val Pro Ile Glu Pro His Ala

65 70 75 80

Leu Phe Leu Gly Ile His Gly Gly Lys Met Cys Leu Ser Cys Val Lys

85 90 95

Ser Gly Asp Glu Thr Arg Leu Gln Leu Glu Ala Val Asn Ile Thr Asp

100 105 110

Leu Ser Glu Asn Arg Lys Gln Asp Lys Arg Phe Ala Phe Ile Arg Ser

115 120 125

Asp Ser Gly Pro Thr Thr Ser Phe Glu Ser Ala Ala Cys Pro Gly Trp

130 135 140

Phe Leu Cys Thr Ala Met Glu Ala Asp Gln Pro Val Ser Leu Thr Asn

145 150 155 160

Met Pro Asp Glu Gly Val Met Val Thr Lys Phe Tyr Phe Gln Glu Asp

165 170 175

Glu

<210> 22

<211> 159

<212> PRT

<213> Homo sapiens

<400> 22

Met Ala Leu Glu Thr Ile Cys Arg Pro Ser Gly Arg Lys Ser Ser Lys

1 5 10 15

Met Gln Ala Phe Arg Ile Trp Asp Val Asn Gln Lys Thr Phe Tyr Leu

20 25 30

Arg Asn Asn Gln Leu Val Ala Gly Tyr Leu Gln Gly Pro Asn Val Asn

35 40 45

Leu Glu Glu Lys Ile Asp Val Val Pro Ile Glu Pro His Ala Leu Phe

50 55 60

Leu Gly Ile His Gly Gly Lys Met Cys Leu Ser Cys Val Lys Ser Gly

65 70 75 80

Asp Glu Thr Arg Leu Gln Leu Glu Ala Val Asn Ile Thr Asp Leu Ser

85 90 95

Glu Asn Arg Lys Gln Asp Lys Arg Phe Ala Phe Ile Arg Ser Asp Ser

100 105 110

Gly Pro Thr Thr Ser Phe Glu Ser Ala Ala Cys Pro Gly Trp Phe Leu

115 120 125

Cys Thr Ala Met Glu Ala Asp Gln Pro Val Ser Leu Thr Asn Met Pro

130 135 140

Asp Glu Gly Val Met Val Thr Lys Phe Tyr Phe Gln Glu Asp Glu

145 150 155

<210> 23

<211> 180

<212> PRT

<213> Homo sapiens

<400> 23

Met Ala Leu Ala Asp Leu Tyr Glu Glu Gly Gly Gly Gly Gly Gly Glu

1 5 10 15

Gly Glu Asp Asn Ala Asp Ser Lys Glu Thr Ile Cys Arg Pro Ser Gly

20 25 30

Arg Lys Ser Ser Lys Met Gln Ala Phe Arg Ile Trp Asp Val Asn Gln

35 40 45

Lys Thr Phe Tyr Leu Arg Asn Asn Gln Leu Val Ala Gly Tyr Leu Gln

50 55 60

Gly Pro Asn Val Asn Leu Glu Glu Lys Ile Asp Val Val Pro Ile Glu

65 70 75 80

Pro His Ala Leu Phe Leu Gly Ile His Gly Gly Lys Met Cys Leu Ser

85 90 95

Cys Val Lys Ser Gly Asp Glu Thr Arg Leu Gln Leu Glu Ala Val Asn

100 105 110

Ile Thr Asp Leu Ser Glu Asn Arg Lys Gln Asp Lys Arg Phe Ala Phe

115 120 125

Ile Arg Ser Asp Ser Gly Pro Thr Thr Ser Phe Glu Ser Ala Ala Cys

130 135 140

Pro Gly Trp Phe Leu Cys Thr Ala Met Glu Ala Asp Gln Pro Val Ser

145 150 155 160

Leu Thr Asn Met Pro Asp Glu Gly Val Met Val Thr Lys Phe Tyr Phe

165 170 175

Gln Glu Asp Glu

180

<210> 24

<211> 143

<212> PRT

<213> Homo sapiens

<400> 24

Met Gln Ala Phe Arg Ile Trp Asp Val Asn Gln Lys Thr Phe Tyr Leu

1 5 10 15

Arg Asn Asn Gln Leu Val Ala Gly Tyr Leu Gln Gly Pro Asn Val Asn

20 25 30

Leu Glu Glu Lys Ile Asp Val Val Pro Ile Glu Pro His Ala Leu Phe

35 40 45

Leu Gly Ile His Gly Gly Lys Met Cys Leu Ser Cys Val Lys Ser Gly

50 55 60

Asp Glu Thr Arg Leu Gln Leu Glu Ala Val Asn Ile Thr Asp Leu Ser

65 70 75 80

Glu Asn Arg Lys Gln Asp Lys Arg Phe Ala Phe Ile Arg Ser Asp Ser

85 90 95

Gly Pro Thr Thr Ser Phe Glu Ser Ala Ala Cys Pro Gly Trp Phe Leu

100 105 110

Cys Thr Ala Met Glu Ala Asp Gln Pro Val Ser Leu Thr Asn Met Pro

115 120 125

Asp Glu Gly Val Met Val Thr Lys Phe Tyr Phe Gln Glu Asp Glu

130 135 140

<210> 25

<211> 3804

<212> DNA

<213> Homo sapiens

<400> 25

taatttcagt gaaattatat aacttggtta catttaggtt acttattaca aatgaaaata 60

aatatactaa cagaagctgc ctcatatgca aatgagtaac atgttagaga ctaaaataca 120

caaaaaaatg catgtgcttt agctcatata aacaatatac aggacaactt accgggtagc 180

ataaacaacc aacaacggac tatcaaaagg aacctcgtca tctagtaact ttaaccttgt 240

tggtagatct cctttttcca tctccatata cacaggattg gaacttgcca tttctgaaat 300

ataaagcata tccttttcca aactttatct cttaggcgga aatattcaat ttatgaacat 360

gttcattcag caatcattag tcacgtacct actgtgtgga cctattatgt gcaaggccca 420

atattaagca ttacaagaga aacaaataaa agtacaagag atgtaatttc tacttttaag 480

aaccttaaaa tctaattggg aggcaaagca tattaaaagt tttaaataag acgaaggaac 540

atataattaa tacatcagtg actattactc ttaaaataat gagtatctag gcctatatat 600

agcaactgtc catataagca cacatcaaaa accaatatac atagctatca tcaatgccaa 660

gttgctcagt tttttctaga actagtattc ctactccatc ttttagaatt aaattcaatg 720

aaattaattt taaaatattt gacctttttt taaagttacc agtatagcaa atactcattc 780

tctgaagaac agaagatttg actttttgga atagccaaaa gtcacttaaa atcaagtctg 840

gtgaaaggag tgatgatcta aaactatttg tggtttaaaa aaaaaaagta tgaatctaaa 900

gtaaagtggg tttttttcca agtagttttc ttttttagtt ttttagaaac agggtctcat 960

tctgttgccc aggctggagt gcagtggtga tcactgcaac cttgaactcc tggctgtgtg 1020

tgtgtgtgtg tgtgtgtgca gcgacggggt cttcctacgt tgcctagctg cagtgcctgt 1080

gtgcacacat gcgcacatgc gtgtgtggag agacagggtc ttgctacgtt gcctagctgc 1140

aatacctggg tgtgtgcatg tgtgtgtgtg tagagacaag gtcttgaaac gttgtctagg 1200

ctggcatgtg tgtgtgtgtt tatatgtatg tgtgtgtaga cagggtcttg ctacattgca 1260

taggctggtg tgtgtgtttt tgtgtgtgta gagacggggt cttgctacgt tgcctaagct 1320

gggcaagtat ttttcaactg cctctgaaga caaatcccaa ataacagttc caaaagctgt 1380

ttcccataat tatcacatca ttagaagggt gaggcctact caccaggttc taagagccaa 1440

cattcatttt ctgatacatg cttttttaaa aaagtcattt tttccccagt ctcattgttt 1500

cccatttgac tgtgtcaggc aataagtact ttaaaggaat tcagaggagg aggccattca 1560

gaggtttggg gaagcctgat gactgcgcgg gagctaaacc agacatatcc acctaaattc 1620

aagtaagcag ccatatcact caaattgccc accatgcttc ctctagccag cactggtagt 1680

aacaactatc actctggctg atggagactc ttttctgctc ttctgtgact gggtatgatc 1740

acataataga gacagataca gtaaatttcc aatgagtaat aatgtcacac atttgaactt 1800

acctgaggag aaatagcttg tttcttattt cacacaaaag acaatctacc tcaactcaga 1860

aaaaaaaaaa ttattatgct tttaactgct atatttgaat taaagcagat ctgtaactat 1920

agatccatgt ttctagaaag ctaaaatatc tttaagtaag atgacataaa aatgtatctc 1980

tattcacttt tggtaatgaa tgaaaagttg cttaaagtct aaagtattag aaatatggca 2040

tctgttattc aagtaggatt tggaattaag aaaattcact tcttcaaaaa catgggacta 2100

tggctgcaga aagggcaatg catatagttt ttagggtatg atagctggtt tctattatat 2160

gtcaggatga catatgcgac cttccgccaa ggtagatact gcgggctatg caccaaagtc 2220

tctgaggcag acatgtaagc gagctcttca cctatattca ttcttttcct cctggacagg 2280

ttacatttcc cagtttcctt tgcagttagt tgtggctata tgacagaatt ctcatcaatg 2340

gaaatgtaca cagaagagag gtaagccact accaggccag gcctataaga cagcactttc 2400

tacatgcttt ccccagacat agcaacccaa acatgaccac atcccttaag ggaagatgga 2460

gctgaaaata atggaaggaa cttggaatgc tagaatgctg aattaccacc tgggagacag 2520

ctacccactg acctggaata cctgtcctgg actgttacat gagcaagaaa tacacttcta 2580

tttatgtatg agttacttca ttatcagata tttattacag cagtttagct acctaagatc 2640

tctctctgcc tcagactgct tatctataaa atggaataac accatctact ccaaacatta 2700

ttgtaaggat gaaatgagac aatgctgaaa agtgtttacc ataatatctg ccacacaata 2760

agtaccccat atagtatttc tgtattagta agttacatga gagattttct tcttttaata 2820

catctgcatt tataaacatt ttactttaac ctcaacttcc ccagcactgc tctaccattt 2880

tctgaatgtc attatgagag aaataaaact aatttctagg gccaggcatg gtggctcaca 2940

cctataatcc cagcattttg ggaggccaag gtgggaagac tgctttgagg tcaggatttc 3000

aagaccaacc tgggcaacac agtaagaccc catctctata aaaaaatgaa gaaatcagag 3060

ggtacagtgg cacatgcctg taatcccacg actcagaaaa ctgaggcagg aggatcgctt 3120

gaacccaagg gatcaaggct acagtgagcc atgatcacac cactgcattc cagcctgggc 3180

acagagtgag accctgtctc taaaaataaa aaatagggcc aggcacagtg gttgatgcct 3240

gtgatcccaa cactttggga ggccaaggca ggtagatcac ttgaggtcag gcgtttgaga 3300

ccagcttggc cgacatggca aaaccctgtc tctactaaaa tacaaaaatt agctgggcgt 3360

ggtggtgcac gcctgcagtc ccagctactt gggaggctga ggcaagacaa tcacttgaac 3420

ccaggaggcg gaggttgcag tgagccaaga tggcgccact gcactcaaac agaatgaaac 3480

tctgtctcaa aaaaaataaa ataaataaaa atttaaaaac taatttctta taatccagtt 3540

gtgaatttaa ccaatgtctg aaagaactat taaaagttaa aatgaatgga aaacagaata 3600

aagggttgac cagaacagat gtgattttct acttaaatct tttttttaaa ccccaaaatt 3660

caaaactgct aatgtttttt aatacgaatt tctatctttg ataaggcaat ctgagtatta 3720

cctttcaatc cttcaataaa agtatcccaa acagaagggc tattactgta actaagcttg 3780

atactctcct tcgctctttt caag 3804

<210> 26

<211> 3804

<212> DNA

<213> Homo sapiens

<220>

<221> misc_feature

<222> (2122)..(2131)

<223> n is a, c, g, or t

<400> 26

ggcttctggc tctgagtgag gtcctgctgc aaggtttcct agatgagcca ctgagactct 60

aataagatcc agtggaaata accaggctct cgtcggaata taagtcccaa gggaagctgt 120

gccagtcttg tgggcgactg cctgacttct cctttcattt cagcaccatg aagcttctca 180

cgggcctggt tttctgctcc ttggtcctgg gtgtcagcag ccgaagcttc ttttcgttcc 240

ttggcgaggc ttttgatggt aaggcttcag aaggtttgca ggatttctga agagaaacat 300

caccctggac ctgataaact ggggaaaatg atgctttcgg aaggctgctt ttgaaccaca 360

gagttgctag tgtctgcgtt gctgaggcct gccaggaact agggtttgct gggttgcctg 420

tctcgagtct ttcagagctg ctgggaatat cccctttccc cgtagtgcag cttctcagga 480

tgtgttaagt ggatggatca catttcagaa gccgctgcaa ggtgtatcaa aaacacatct 540

cctgagccgt aagggacggg gcatccagta acaacgcaca cggggtattt ttgggcttcc 600

ttaagatttg agccgctgcc ttaggttgtg ctgcccaatg tgcctgggga gctgctaaac 660

agattagaga gtcgaggatt gttgtcagtt actcagagaa agaacaatca tcctttccag 720

gagcacctga gctgtttgtt ttgcgtagaa gatgcaaaat aaggcctgca atgggtataa 780

aatgtccctc agcataaatc gcataggagt atgactaagg ctgttgactc ttctgtcttc 840

tttctccttc ctccttcgat ttcctagttg gataatgtac agggctcttt agcctcgctc 900

tgtcaggggc tcccttcctg gtttgttctg tttccattct tccttctcca gccttcttga 960

caagagctgg gaactaacgt gcctcaagcc cccacaagga ccacagcatt ttctcattta 1020

gtttcagaat gactctgtga cgcaatcttc ctctcttgga aggtgagaaa gctgatcttg 1080

gaaggtgaga aagctgagac ttagagcagc tgaagccaat gcccagggac ttactgccag 1140

tcagcaggtg gcagggcaga ggtttgagcc cggctgtgct tgaggtcagg gctcttgcca 1200

ggtagacgca tcactgacca cctcctagag gttgatggtt atgaatctca ggcacacctt 1260

ggcatcacct gaaataccca tgccttcaac tccccagcag agtctgcaga aactggcctg 1320

gggtgtggcc tgggcactgg gactttcagt ttctctctgg gtgattagaa agtgcagcca 1380

aggctcacgc ctgtaattcc agcactttgg gaggccaagg tggatgaatc acttgaggtc 1440

atgagttccg gagcagcctg gccaacatgg tgaaaccccg tctctactaa aaatactaaa 1500

atgtagccag gcgtggtggc aggcacctgt aatcccagct actcaggagg ctgaagcacg 1560

agaatcactt gaacccgaga agcagaggtt gcagtgacta gagatcgcac cagtgtcctc 1620

caacctgggt gacagagcga gactccatct aaaaaaaatg aaaaagaaag tgcagccaag 1680

gcagagcacc actgccctat tgcttcctca agcaacccac agcatcagta cagcctacta 1740

agaaagtatt tagggacttt tatgctccta acagtcactg gaactcacgt cacaatgacg 1800

tgtattccat ttgcaagaat atatacttta ggtcggggtg cggtggctca cgcctgtaat 1860

cccagcactt tgggaggcca aggcaggggg atcacgaggt caggagttcg agaccagcct 1920

gaccaacatg gtgaaatccc cgtctctact aaaaatacaa aaattagcca ggcgtgatgg 1980

cgcatgcctg taatctcagc tactcaggag gctgaggcag aagaatctct tgaacctggg 2040

aggtggaggt tgcgatgagc tgagatagca ccactgcact ccagcctggg cgacagagca 2100

agactctgtc taaaaaaaaa annnnnnnnn naaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2160

aaagaatata aactttagta gtcagggcag aagtactctg tgtctgccac ctttctcagc 2220

atcagtattc catgtcacta cctcattcat acacactcct ggatcttatc ataggcagct 2280

tcattctata gcagtggctc ttcaccaggg cacttgaaga agccaactag gataaaggaa 2340

tgtgcttctc aacccatggt atccaaggct gctatgatca caggctgaaa gcttgaagtc 2400

agtggaagat ttgtccttcc tcattcccct ctaaggtgtt gttggagtct ttatgttctc 2460

ctgatgtccc ttctgccttt cctttccttt ccaggggctc gggacatgtg gagagcctac 2520

tctgacatga gagaagccaa ttacatcggc tcagacaaat acttccatgc tcgggggaac 2580

tatgatgctg ccaaaagggg acctgggggt gcctgggctg cagaagtgat caggtaactg 2640

gagctcctgg gacgttaggg ctgggtgagc agagcttgcc tgccttggac agtcaggagg 2700

gagacgagct ccttgtggag aagttagagg ctgcggcccc tcctcctctt gccctctctc 2760

tgcctctgtg ctcagtgtga ggtctgagtg gatggtagga gtgagtgatt cctcatcctc 2820

cctctctggg tgctgttcat ccagcctagg ggtgcccagc ctggctgaat ggggtggtgc 2880

ccagtgtttt catccctcct tccttggcct ttctgggctc ctctctgagc cctcccttgg 2940

aacagggaga atgggagggt gggctattgc tcactggcct gattattaat ctccttcttg 3000

cctgccttga ttacagcgat gccagagaga atatccagag attctttggc catggtgcgg 3060

aggactcgct ggctgatcag gctgccaatg aatggggcag gagtggcaaa gaccccaatc 3120

acttccgacc tgctggcctg cctgagaaat actgagcttc ctcttcactc tgctctcagg 3180

agatctggct gtgaggccct cagggcaggg atacaaagcg gggagagggt acacaatggg 3240

tatctaataa atacttaaga ggtggaattt gtggaaactg ggtgttatac tttgtggtat 3300

agactgcctg tttagtatga aggggcgatc catgcacatc taagtgaacg tggaggctgg 3360

gtgggtggga gacgactcct gggcacacag ggcatcctgg gcatccctga ggcaaggaca 3420

tgatgagttc agtggccacc cccacaggat cccaggggct tcagcagatc ccacccctta 3480

ccccatgtga gcagctgccc agtgagtctg taggaacccg agccacattc ccagtgagtt 3540

caactgcacc ccggcacgtt ttgctagcac ctcaatggag agctccttgc ttgcagcttt 3600

ggcttgtggc acccagcaaa agcttcctgc cacccagtgg ctacagccac acactctcca 3660

gcaagattta atctcagcct tgtgaggagc cctttcccaa atttatttct ttctgtgttt 3720

tttatccctt agtagctaat ctcatgttag ccattaataa ctctctatgt taaacccttc 3780

cttttgtatc tgcggctaca ttga 3804

<210> 27

<211> 3804

<212> DNA

<213> Homo sapiens

<400> 27

gtataaatgc agaggtgcag taactgggct tttcaggata tccagatgga gttgtggtgt 60

tgttttgctt gtggttttta acgttaactt ttttttcccc tttattttaa gagaagcaca 120

aaatgaacaa actagtgagc ccagcaacat ggatggaaat tccggagatg cagactgctt 180

tcagccagca gtcaaaaggg tatgggcaaa aaaatatgaa ccatttgggg ctcaagtttc 240

tccaaatact ttatgtgact gcaagtactg tatacgctta tttcctgtga ctcagttctt 300

ctaactaaga tgttaagcat ttggcttaaa gtgtatagca ttacaaagag tatttcccca 360

gctttggctt gccagccaac tttccattga ctctagcctg ttagccattt ttattgtttt 420

ttgtttgttt gtttgtttgt tttcctcaca tgtacacata catacagatt gttcttatat 480

gtgattttgt tctctgggaa taaaatcttc attcaacaga ggcaatatga cagaaaaacc 540

gaagtttcat gtatatgatt tttcaaagaa agtgaattgg ccctcatgtt aaacctagca 600

tttcagagct gaaagtgtct tctcattaaa tattgaagaa atcatttgag ggtgtggaga 660

aggatggaca gaattagctg cttgtgtatt tattcttctc ctgcaacttt gccacgctat 720

tttgtacctc ccttcctaat tatgataaag ctttcttaga gagcagtcag gcaatgtgta 780

ttaaatgttt aaagctttac acccttagtt ctacttgtgg acatttattt cttaagaaag 840

atgtatacta agatttagat agaaatattc attacagtat cataataaag acagtagcaa 900

ggattctgtt atctgtgttg cattaataca atagagattg atgcaactgt tcattatttt 960

gaaagcatta atgataatat tgcatcaaag agttcactga acagattgta cagtacagtt 1020

ttacacacaa aaaaaatagt ttgtgagctt taaaagggcc ttcaaatgaa tatgctaaac 1080

ggttatcttt caataaagag agtatgggta agtcttaatt tctttcattt atttcagtaa 1140

tttaatgttt ttgttgttgt tattgtttgt ttttttgaga cagagtcttg ctctgtcacc 1200

caggctggag tgcagtggtg caatctcagc tcactgcaat ctcggctcac tgcaacgtct 1260

gcctcctgga ttcaagcaat tcttctgcct cagcctccgg agtagctggg attacaggcg 1320

tgcaccacca tacctagcta atttttgtat ttttagtaga gacggagttt tgccatattg 1380

gccaggctgg tgttgaactc ctggcctcat gtgatccgcc catctcagcc tcccaaagtg 1440

ctggggttac aggcatgagc cactgtgcca gcctatttca gtaacttaat gtttttacag 1500

gcatgtatta cctataaaat taataaagcc agtgaggtat ttcttttttg aactaaagca 1560

aagctaataa taagttatag agaagttaga gaagaaatct attaagtgat actttctttg 1620

tatactgttg ggctgagtac ccttgattct tggtggtgaa caagttatca gaaatttctt 1680

ggccaggagc cgtggctcac acctgtagtc ccagcacttt gggagtccaa ggtgggtgga 1740

tcacttgagg tcagaatttc tagatcagcc tggccagcat ggtgaaaccc tgtctctatt 1800

aaaaatacag aaattagcca ggcatggtga cgtgcgcctg taattccagc tacctgggag 1860

gctgaggcag caaaatcact tgaacctggc aggcggagtt cgcagtgagc tgggatcgcg 1920

tcgctgcact ccagcctgga tgacagagca agactccatc tcaaagaaaa aataaaaaag 1980

aaatttattt acttgtgtga atttttacaa tacagatgct tctcgactta aatggggcta 2040

catcccaata aactcataag ttgcaaatac tgtaaatcaa aaatgcattg aatacaccta 2100

atgtatggaa caccatagtt tagcctatcc tactttaaat gtgttccgaa cacttagatt 2160

agcctgtagt tgggcagcat tacctactat aaagtgtatt ttctaataaa atgttgaata 2220

tctcatgtaa ctcattgaat actgaaagtg aaaaacaatg tatgggtact caaaatatgg 2280

tttctctact gaatgtgaat cactttgaca ccatcataaa gttgaaaaat tccaagtcaa 2340

accattgtaa gtcaggggct atcagtattc agtggtaaat gctggctcta actattcttc 2400

caagtcagtg gttgactgct gtttattcta taaagggtta caatttatag attctctcac 2460

ttgtagaatg agagattcag aattaatagc agacagagtc cctaccttga tggagctttc 2520

atttaagtgt gaaagtcagg tgacctaaca aggccttggc ataagtttag gatttggatt 2580

gttatgggag cttgggtagg gacatgtcat aggtaaggca acagcagggg tagagataag 2640

cttgacatat gtcaaaaatc atgaagacat cagtaatcct tgaagttggc tgaaaggtat 2700

agagttgaga aagtagttaa aaaaaaaaaa gtcaggctga gtctaggtaa ggatgtgttt 2760

ctctgaggtc agatttgttc ctgtaccata aagggactat ttagaatctt aaagctggag 2820

caatttaaaa cgttaagttt tcagattgag gtcagatttg tgacttcatg tgaggtcaga 2880

tttgttcctg taccataaag ggactattta gaatcttaaa gctggagcaa tttaaaacgt 2940

taagttttca gattgacgtt ttttgaggta tagttaataa cctgaatgtt ctgattctag 3000

tcttggtagt caataagagt tgaccagatg aatttcatag ctttgtagag gatgaaatat 3060

ttcaaggctg atttgcacaa atgtttacat agatcatgta tctttcataa gtaatatgtt 3120

tgtattatta caaggctgta aaaatttaag caggttgtta atagcacagg gggtaacaga 3180

ttaataaaat taatgaataa aattactaaa agagtccaga agtaaaccca aatacgtgga 3240

ggaattaagc atatgtatga tacacatgac attttaaaaa tcagtgggaa aaggtaaatt 3300

attttacaaa tggtgttaga agcactgatt gataattttg ttaaaagaaa cttagattcc 3360

ctattttact cctaatccaa aataaattct gagtggatct aagattaagc aaaaattaag 3420

ccggaagctg agcatggtag catgtgtctg taatctccgc aatttaggag actgagtttg 3480

gctggggagg tggtgatatg cgcctagaaa aaaaaaattt tttaagccac agatgtataa 3540

gcaaaaagcg ggcaaagagg cggaattttt tttttttttt ttgatgaagt ctcacttgtc 3600

gcccaggctg gaacgcagtg gcgtgatctc agctcactgc aacctctgcc tcccgggttc 3660

aagcgattct cctgcctcag cctcccaagt agctgggatt acaggcacct gccgaggaga 3720

ggattttttt ataattaaaa caaaacaaaa caaaaaaaca ccaaactgga agataaagta 3780

tttacaacat gtaaaagact gttt 3804

<210> 28

<211> 122

<212> PRT

<213> Homo sapiens

<400> 28

Met Lys Leu Leu Thr Gly Leu Val Phe Cys Ser Leu Val Leu Gly Val

1 5 10 15

Ser Ser Arg Ser Phe Phe Ser Phe Leu Gly Glu Ala Phe Asp Gly Ala

20 25 30

Arg Asp Met Trp Arg Ala Tyr Ser Asp Met Arg Glu Ala Asn Tyr Ile

35 40 45

Gly Ser Asp Lys Tyr Phe His Ala Arg Gly Asn Tyr Asp Ala Ala Lys

50 55 60

Arg Gly Pro Gly Gly Ala Trp Ala Ala Glu Val Ile Ser Asp Ala Arg

65 70 75 80

Glu Asn Ile Gln Arg Phe Phe Gly His Gly Ala Glu Asp Ser Leu Ala

85 90 95

Asp Gln Ala Ala Asn Glu Trp Gly Arg Ser Gly Lys Asp Pro Asn His

100 105 110

Phe Arg Pro Ala Gly Leu Pro Glu Lys Tyr

115 120

<210> 29

<211> 122

<212> PRT

<213> Homo sapiens

<400> 29

Met Lys Leu Leu Thr Gly Leu Val Phe Cys Ser Leu Val Leu Gly Val

1 5 10 15

Ser Ser Arg Ser Phe Phe Ser Phe Leu Gly Glu Ala Phe Asp Gly Ala

20 25 30

Arg Asp Met Trp Arg Ala Tyr Ser Asp Met Arg Glu Ala Asn Tyr Ile

35 40 45

Gly Ser Asp Lys Tyr Phe His Ala Arg Gly Asn Tyr Asp Ala Ala Lys

50 55 60

Arg Gly Pro Gly Gly Ala Trp Ala Ala Glu Val Ile Ser Asp Ala Arg

65 70 75 80

Glu Asn Ile Gln Arg Phe Phe Gly His Gly Ala Glu Asp Ser Leu Ala

85 90 95

Asp Gln Ala Ala Asn Glu Trp Gly Arg Ser Gly Lys Asp Pro Asn His

100 105 110

Phe Arg Pro Ala Gly Leu Pro Glu Lys Tyr

115 120

<210> 30

<211> 122

<212> PRT

<213> Homo sapiens

<400> 30

Met Lys Leu Leu Thr Gly Leu Val Phe Cys Ser Leu Val Leu Gly Val

1 5 10 15

Ser Ser Arg Ser Phe Phe Ser Phe Leu Gly Glu Ala Phe Asp Gly Ala

20 25 30

Arg Asp Met Trp Arg Ala Tyr Ser Asp Met Arg Glu Ala Asn Tyr Ile

35 40 45

Gly Ser Asp Lys Tyr Phe His Ala Arg Gly Asn Tyr Asp Ala Ala Lys

50 55 60

Arg Gly Pro Gly Gly Ala Trp Ala Ala Glu Val Ile Ser Asp Ala Arg

65 70 75 80

Glu Asn Ile Gln Arg Phe Phe Gly His Gly Ala Glu Asp Ser Leu Ala

85 90 95

Asp Gln Ala Ala Asn Glu Trp Gly Arg Ser Gly Lys Asp Pro Asn His

100 105 110

Phe Arg Pro Ala Gly Leu Pro Glu Lys Tyr

115 120

<210> 31

<211> 5687

<212> DNA

<213> Homo sapiens

<400> 31

ctctctggtt gcccttaaca ttttttcctt catttcaact ttggtgggtc tgatgattat 60

gtgtcttggg gttgctcttc tcgaggagta tcttagtagt attctctgta tttcctgaat 120

ttgaatgttg gcctgtcttt ctaggttggg gaagttctcc tggataatat cctgaagagt 180

atttttcaac ttggttctat tctccttgtt actttcaggt acaccaatca aacgtagatt 240

tggtcttgtc acatagtccc atatttcttg gaggttttat tcgttccttt ttattctttt 300

ttctctagtt ttgtcttctc gctttatttc actaagttga tcttcaatct ctgatatcct 360

tgcttctgct tgattgattc agctatcccc cgctcgatat tacaaaccat gtcacgaggc 420

gtggacaccc cccatgatat ggggagtatt atcacccccc tcttccccca ctggatatta 480

caaaccatgt catagggagg tggacatccc ccacaatatg aggagtaata tcacacccct 540

ttccccgcag tggatattat gaaccatgtc acaggcggtt aaacaccccc aacgatatgg 600

ggagtaatat cacactcctc tcccccctgg atattacgaa ccatgtcatg gggggtggac 660

accctttgca atatggggag taaaatcacc cccctctccc ccaactggat attatgaacc 720

atgtcacagt gggggaaaaa tcctctgtga tatgcagagt aatatcaccc cactctcacc 780

acctggatat tacgaaccat gtcacagggg ggtggacacc ccccaagatg ggggagtaat 840

atcacctcac tctctgccac cagatattac aaactgtgtc acaggggggt gaacaacccc 900

cacaatatgg ggagcactat cacccccctc ccccagggta ttatgatcca tgtcacaggg 960

gggtggatac cacccactat atggggagta atatcacctt tctctcccgc cctggttttt 1020

atgaaccgtg tcacaggggg gtggacaccc cttgcgatat ggggagtaat atcacccccc 1080

tctccaccat ctggatatta cgaaccatgt cacagggggg tggacacccc tgcgatatgg 1140

ggaggaatat gcccctctcc ccacctggat attacaaatc atgtcacggg ggacggacat 1200

cccccacaat atggggagta atatcaccac actctcccct gctggatatt acgaaccata 1260

tcacaggcgg ctggagacac aaggcattaa caatatttcg agtaatatta tctttccctt 1320

tgaacattat gaacaatatg acagaggggt gtacacctcc tgcgatattg ggagtaatgt 1380

catcccctcc cccactggat attaggaacc atattactgg gggatgtatt cccccttcta 1440

gattgggagg aagatcatac ttgccctccc tgaatatttg aaacaatatc ataggggttt 1500

gtacactttt acgatattgg gagtaatatc atcctttctc cccctggaaa ttaggaacaa 1560

tatcacaggg gtggtgtaca cccctgcaat atttagggta atattattgt cttctcccct 1620

cgatattagg aacaatatta caaggacggt gtaaagtacc tgccaaattg ggaaaaatac 1680

tatcctctcc ctcttgtata ttagaaacaa taacacaggg ggaatgtaca cccactgcca 1740

tattgggagt aatatcatac tcgccccatc ccccagatat taggaacaat atcacagcag 1800

gggtgtacac ttttacgata ttgggagtaa tatcatactc tctccccctg gaaattagga 1860

ataatatcac agagatggtg tagaccctct gcaatactta ggataatatt atcatctccc 1920

ccctcgatat taggaacaat attacgggga gtgtaaatta cctgccaaat tggaggtaat 1980

cctctcctct ctctccctgt attttagaaa atataacaca caggaaatgt acaacactgc 2040

gatattcgga gtaatatctt cttctcccca cctggatatt aggaacaata acacggacgg 2100

ggcgtacacc cctcgcgata ttgaatgtaa tgtcatcctc tccctccctt tatattacga 2160

acaatatcac aggggggtgt acaacccctg caatattgga agtagtatca tccattctcc 2220

catgaatatt aggaacaata tcacaggggt agagtacacc ctctgcaatt tcgggagtaa 2280

catcatcctc tcgttccctg gatattataa acaacaccac gggggggtgg gggtgtacac 2340

acccttcgat attgggagta atataatcct ttccctccct atatattaga agcaatatca 2400

caggggttgg tgtaaacttc ttgcgatatg gggattaata tcacccccct ctcctgccct 2460

ggatattatg aaccatatca cagggaggtg gacacacttt gcgatatggg gagtaatatc 2520

acgcccctct cccccccgat attacgaacc atatcacaag ggagtggacc ccccccacga 2580

tatggggagt aatatcaccc ccctctcccg ccctggatat tacgaaccat atcacagggg 2640

gatggacacc ccccgcgatg cggggagtaa tgtcaccccc ttctgccccc taggatatta 2700

cgaaccatat catggacacc ctccacgata ttggaaataa tatcatcctc tcccccttgg 2760

atattaggaa caatatcaca gggggttgta cacctcctat gatattggaa gtaatatcat 2820

cctctccctc ctggatatta gcaacaatat cacagggagt gtgtacaacc ccagcgatat 2880

ttggagtaat atcaccctct caccccatgg atatgagaaa caatatcaca ggggaggtgt 2940

acatcccacg tgatattgtg tgtaatatca ttcttcccca acccctgcaa tattgtggtg 3000

taatataatt ctctcccttc ctggacatta tgaacaatat cactactagg tgatacatta 3060

ggagtaatgt atccatagga tattatgagg aatatcacag ggtgtacacc cactgtgata 3120

ttagaggtaa tatctcccta aaatattaag aagaatatct tacacccact gtgactttag 3180

aagtaatatc tccctaaaac gttacaaata acatcgcagg gtgtacactc acagtgatat 3240

taggagtaat atctccctag aatattacaa atacacatgg tgtaaaccca ctgtgacttt 3300

agaagaacta tctccctaaa ataatacaaa aatatcgcag tgtataccat aatatcccct 3360

agaatatcat aaataatatc acagggtgta cacccactgt gataatagga ataataccac 3420

cccaggatat tatgaataat gtcacaggct gtacacccac tatgacatta ggagtaatat 3480

ctccctagga cactatgaat aacatcacag attttacacc catggtgtgc acccactatg 3540

atattaggag taatatctgc acaggatata acaaataata gtacagggtg tacacatatg 3600

atatacaccc actgtgatat taggagaaat atatccctag gatattatga ataacctctc 3660

agagtacaca cacatggtat acaccctctg tggcattagg aacaataact ttctaaaaca 3720

ttacgaataa catcacagaa tgtacacaca tggtttacac ccactgtgac aggtgcaata 3780

tctcccttgg atattatgaa taacaacaaa ctatcactgt catattagga gtaatttctc 3840

cctagaatat tacaaataac atcacagggt gttcatttat ggtgcacacc cactgtgata 3900

ttaggagtaa tatctcccta ggatattact tttcatataa aagtgtgtac atccactgtg 3960

atattgggaa aaatatttct ctaggatatt atgaataata tcacagagcg tacacccact 4020

gtgatattag gagtaataat tccctgggtt attatgaata atatcacagg atgtacaacc 4080

actgtgatat taggagcaat atcttcctag gatattacaa ataatatcac agggtgtaca 4140

cccactgtga tattaaagta atttttaggt tattgtgaat aatatcacca agtgtacaaa 4200

catggtgtac actcactgtg atatcaggag taatatctca gtaaaatatt atgaataata 4260

tcacagggta tacacccact gtgatattag cagtagtatc tttgtaggat attacaaata 4320

atatcacagg gtgtatgccc actatgacat tagaagcaat atctccctag gatatcaaaa 4380

ataatatcac agggtgtaca acttctacat cccaggttct aagggattct cctgcttcag 4440

cctcctgagt ggctgggatt acagatgccc accaccacac ctggctaatt tcgtattttc 4500

agtagagatg gggtatcacc atgctggtca ggctggtctg gaacttctga cctcaggtga 4560

tccaccagcc tcggccttcc aaagtgctgg gaatacaggt gtgagccaac gtgcttggca 4620

gagagttata tattaaataa atctggaaac atagctccca tgtttgagtg tgcatttact 4680

tttatgaaga aattatgtca gaaaacctaa ggatgataat aaatatgaaa agtaactggc 4740

atgtaaaaag gtcttttgat taagaactat aaggttcgat ttcattttta gataacgtga 4800

tcctagctct tgtatagtgc ttataaatat tctacatcaa aggaatttgt tgcacagtgt 4860

cagaataaaa taaagtgtat ttcactgctt cttaattttt aaattagact gagtttgttt 4920

tcctagagag agaagaacat tttttatttt ttctgaaaag agtaggccat attttactga 4980

gatcttagat ttgttatata ttaggttttg gtcttctaac attctccagt ggattttctc 5040

taaagtaggt atgcacagaa agagttgaat agcaaaaaag taaatcatgt aataattctg 5100

agatttttgg gtttgtcaca actgagaaat attgctgagg gtgtatggtc ctcaagtgtg 5160

aaaatgttcc ttgtgaattg cttgtatccg aaatatacac acaacattaa gtcctggttt 5220

ttatctttta ttttttccaa tccttttttc ttctcaaggt gtccaagtca cacagagcca 5280

cagaatctca caggtgtctc agaattcctc ctcctgggac tctcagagga tccagaactg 5340

cagccactcc ttgctgggct gttcctatcc atgtgcctgg tcacgatgct ggggaacctg 5400

ctcatcatcc tggccgtcag ccctgactcc cacctccaca tccccatgta cttcttcctc 5460

tccaacctgt ccttgcctga cattggtttc accttggcca cggtccccaa gatgattgta 5520

gacatgcaat cacatagcag agtcatctcc catgcaggct gtctgacaca gatacctttc 5580

tttgtccttt ttgtatgtat agatgacatg ctcctgactg tgatggccta tgactgattt 5640

gtggccatct gtcaccccct gcactaccca gtcatcatga atcctca 5687

<210> 32

<211> 5687

<212> DNA

<213> Homo sapiens

<400> 32

attgaatttt atctcagagc ccacatgaag caggatcaaa gtcagtacac atgaaaacta 60

gagcccaaag actataaagc atgaaataag gatttaagct aaccctatct tgtaaggggt 120

ttgtaaagcc cagcttgcat ctgagctaca ctagcaccag gacagccact cagtaatggg 180

gtttctcaag gttattgctt ttcattcagt tgaaatgaga gtcatttctt acccttatgc 240

cctgtgagat ttcactggag gttgttcact gaaacatttt catatcattg catcaaccct 300

cttgaactca ctgtgcctgc ccccagttca gtctgtgact cacaagtacc ctgcagcaaa 360

agaaatccaa tagagggcaa atccctcacc ttaccttcct ttctaagacc tttgatgttc 420

tcatgtgtca tttcataatt gggattgtca attagtcgcc tcatctctgg tcctcacttt 480

cctctctccc agccaaactc aaccttcagc ccacacaatg gaattcaaca aaatgaggta 540

acagttttct gtgtgagtca ctctgggcaa ctctgttcac agagcactgt gaggtgagca 600

gccagaaccc aggcaagtgt ttcagccatc caagaactgg caggcagccc aagagacact 660

ctcacctgat gacagactag caggatgagt cctggaggaa atggttccca acagctgcag 720

aaggagtctc ttggctcatg cacagcaatg ctcttctcaa ttaaaaacgt tgtcattatt 780

gacactgcag tgtaaaatcc ttttacactg tgctcacatt tctacaggcc ttcacctgct 840

ctgcccatta aagacaagac ccttccatga gatgatgaca tctctaagtt actgttccac 900

ccaaacagtc ctatataatg aagagaaaaa ttttgctggc cctcaaaagg caaacacaag 960

gagaaagatt tccacaagct gtttctcttt gctgagcact tagaggaaaa ctgtaagtgg 1020

ttggaagaag gctttgtttt ctacaagact tttagttatt cctcagaaat tttcctgctt 1080

attcccagag gaggtcatct cttagatgct gtcagtcaga tagggattgg cagccaagca 1140

gaggtgctca gagaggtttc caactaatgt ggccagcgga aaactgccaa agaagcaggg 1200

atccttagga caaataaact ggaagatatt ttggggataa aaataaatcc ttttgaaaat 1260

gaaagatgga gagatgctgt atatacaaat tgccctgttc tgaacaatgt tgtcactagg 1320

actggccctg gagaccaatg atacaaacca aaatgttctc agacatgctt tgatggtctt 1380

tttctccaaa gttatctatt ctgtttccat ttcattctca caggacttgc catggggttc 1440

tcataagatt tcacattggt cataatccag gtggccctgg actgcaacct ctgagttggc 1500

aacatcagaa taggaattac gaaaaaccaa tttaaagtta aatacagaca caggcaaaag 1560

agagatgggt tgtcgaagct agtgcctagg tggacactgc ctcacatttt taattccaga 1620

agccatcagt actgagtgtc agatctcatt agtcaaacac agtgatcagg aatcctgttt 1680

tcctggagga tttccttgag ggagggacca ctcaagagtc tgaaatattt cacgtcatag 1740

agtatggatc tcaccccaac acccaatcag aaaataggga gaactggaaa ccaaaattcc 1800

ccctcccgct gtggaaggat gaaaaccaga gtgttggagt tctgtcctga taatggagca 1860

gacagctagg cagcaatcaa tgagggccag tacaggaatt cagtgctaag tattgggtca 1920

taacagaagt agggaaggta ttaatccagt gctatatgag gatcctggga cactggctcc 1980

tagtaatcta gttataacta ttagcaaaaa agaaaaaaaa aatcagtgat gtgaagagat 2040

ggcctaaagg agctccagca atatagctaa gcagctggca agtggtctga ggagcattgc 2100

aattccaggc ctcctaaggt ggcagtacgg gcactggtaa gacattctgc tgtggtgaaa 2160

ctagtttacc atagaggatt cacaattaaa ataggcaaac aggaaatgca agacagaggc 2220

taacaaaggg tttttttttt ggtggggggg agttgtttgt ttgtttgttt gttttctgag 2280

acggagtctt cctctgttgc ccaggctgga atgcagtggc acgatctcag ctcactacaa 2340

cctctgcctc ccaggttcaa gcagttcttc tgcctcagcc tcccaggttc aagcagttct 2400

tctgcctcag cctcccaagt acctgggact atagctgtgt gccaccacat tgactaattt 2460

ttgtactttt agtacagact gggtttcacc atgttggcca ggctggtgtc gaactcctga 2520

cctcaagtaa tccccccgcc ttggcctccc aaagtgctgg aattacaggc atgagccacc 2580

acacctggcc agtttttggt aattcttaaa gaactcaatg agcaacactc aaacaaccat 2640

aaagactata gagctcatgg ttgaatttta gatagctaaa cagacaggag tttttgtaag 2700

ttttgtaagt cttgctcatc cttccctctt ccatcctcta tctcaactat tctgtctacc 2760

attaaagcac cttagacctt gagtttggca atgcaacaag tgtgtgctca acacgaaata 2820

ggtaattcaa tagcaaagcc ctaaaacagc ctggcttgat tatttctcag ggcatgcagt 2880

tcctttgaag caggatcatt ttaataataa taataataga aataataata gaaattgaag 2940

acaattattt cacaatttcc atacacctaa gagctataca tatgaatgat aatgcataat 3000

tgtaaagcat gcatattaca ggtaataaat atgttagcta attataaaca atgcccattt 3060

tcatatagtt tatccttgcc aaataaaact gtaaaaaaaa gacacctttc aaatgctgct 3120

aaggagtaat acctgaatga ggttgattta atggagtctt agttcctgca tgtgttctaa 3180

ttgaatagac tatgtagtaa ttcccttaca tacccatcca tgtccaagaa cagtgaagat 3240

ctttatttaa tatgaattat tgcagatgat tagcacagtc tagccaaacc attccagtaa 3300

ttgtttttac ttgttatatt aatatataaa ttctcaaagg atataacagt gatgttgggt 3360

gaatttcact gaatgatagc tcaaacacct gaaatattga ctaagaaaac taatttatca 3420

atactgataa tcaattttaa tatgttaatt gattgtaata caggattctg tggttcaaaa 3480

aaaaagaaca agcaaaaaaa ctttcttcca tttccaaata ccaattaata gatctctact 3540

tccccttgga tttcttctta ccacctacca cctccaatct tcattctttc ctcacaaact 3600

aaacataaaa gttacctaca aagcatagaa tctgtgttaa aggatattct tgcttgtttt 3660

aagtccaaaa ttaaacagct ctgaattatt aaaaagcaca tgaattcaaa tgtcctattc 3720

taataagaaa atggtttaca tttctctatg ttcaaggaaa aaaatagtca agggtgtaca 3780

agtggggtaa aaattatttc cagtaggtta tgtgatttaa gttatagaaa cgaaccaggc 3840

aattcaatta aatgtcatgg aaagtaggtt ttttcttttc ctcttttttt ctaatatgta 3900

cactttgtga gaagataaat ccatagtgtg ataatttgtc cactgggtcc atcagacact 3960

ggagacagct tcctaagaat tataaggctt ctaaaggctt ctaaagccta aattgcctag 4020

agcattttgt gtgccaggca ctttgctagg tgccctaggg atgcaagaag tataaatgtt 4080

ttatgagaat acaggctgga aatgtattct tgattattcc tgtggaattt ctaggcagaa 4140

aagagtctaa tggggtatag gtatattttc tcaacacaat tttctgagcc tttaccagat 4200

gcagttctat ggtttgaatg tgtccctcag agtttgtgtg ttggaaactt aatccccaat 4260

gcaataatgt tggtgaggcc taatgaaagc ctaataatgt aggtgaggcc taatgagagc 4320

tgtttagacc atgaaggctc ttccctcatg gatggattaa tgctgttatg gtgggaatgg 4380

gttcattatt actggggtgg gttcataata aaaagatgag tttggcctgc tattctctct 4440

ctttctcatc ctctcttcca ccatgggatg acacagcaag aaggcccctg caagatgccc 4500

tcccctcagt attggacttc acagcctcca ggaccataag ccaataaatt tttgttcatt 4560

ataaatttcc cagtctgtgg tattctgtta tagcaacact caatttatgc attacttcca 4620

gattcttatg gctataccta cttctcacag tttgtattca cccctccttc aaccaagtac 4680

ccttaacaca gttcccatag tcacaaagcc aggtcactga agctgccctc tctccaacca 4740

cacacatata gatcaaatga ccccagacat agagctgatt gagaaggagg gaccagtacg 4800

agctctgctt ccccagcagc ttcctggaaa gaagaggcaa tacaacccaa cccaaaagtg 4860

caagagaagt aacacctcat gggatgagct taattaatca atgggagagg acactagaag 4920

acactagagg atctcccttc ctccctttct ttcccacttc accccctcca gtctctgaac 4980

catgagctat ttcaaaggtg cagtaatgct atatttggct tctctgaaga tatcctatga 5040

ggccaagtca tcagctttgt tcattatcta agagtggtgg ccagctcacc agcacttccc 5100

atcatgtttg ccctccctct ttcccttgtg ttacttccca ttttccctta cttctgcttt 5160

cttggcatta aattctactc tgcaatgtta ggatataagt ttttgcctca gattctgttt 5220

tctaggaaac ccatgctaag acaacactgg cagtggccct ggaaaagtaa acctcatgat 5280

ggatttggag ttggattgtt cactgatctg aaggacagag gactccactt aagtggtaag 5340

cagtgtagct atgaactctg ccacgcaggc ctcacaatta ctgaggcttc ttttacctgt 5400

ggttaactgg gacacagaac agcaggaaat tgagtgtaga ggttatcaag tagctgcttc 5460

acttaattgg tataatttta tggagttaac ctggtttaga gtccagagaa cattccacat 5520

agcctagaaa gggtagttat ttgtccttac cataatcaag tcatactttg aatatgagtt 5580

ttccttccct gttcagcacc acttctctta gacttaagaa tgcctgatct gttgatatta 5640

tgtcccatgt aacattgcct gagacaaaga tatccatgta ccttaaa 5687

<210> 33

<211> 140

<212> PRT

<213> Homo sapiens

<400> 33

Met Gly Phe Gln Lys Phe Ser Pro Phe Leu Ala Leu Ser Ile Leu Val

1 5 10 15

Leu Leu Gln Ala Gly Ser Leu His Ala Ala Pro Phe Arg Ser Ala Leu

20 25 30

Glu Ser Ser Pro Ala Asp Pro Ala Thr Leu Ser Glu Asp Glu Ala Arg

35 40 45

Leu Leu Leu Ala Ala Leu Val Gln Asp Tyr Val Gln Met Lys Ala Ser

50 55 60

Glu Leu Glu Gln Glu Gln Glu Arg Glu Gly Ser Ser Leu Asp Ser Pro

65 70 75 80

Arg Ser Lys Arg Cys Gly Asn Leu Ser Thr Cys Met Leu Gly Thr Tyr

85 90 95

Thr Gln Asp Phe Asn Lys Phe His Thr Phe Pro Gln Thr Ala Ile Gly

100 105 110

Val Gly Ala Pro Gly Lys Lys Arg Asp Met Ser Ser Asp Leu Glu Arg

115 120 125

Asp His Arg Pro His Val Ser Met Pro Gln Asn Ala

130 135 140

<210> 34

<211> 128

<212> PRT

<213> Homo sapiens

<400> 34

Met Gly Phe Gln Lys Phe Ser Pro Phe Leu Ala Leu Ser Ile Leu Val

1 5 10 15

Leu Leu Gln Ala Gly Ser Leu His Ala Ala Pro Phe Arg Ser Ala Leu

20 25 30

Glu Ser Ser Pro Ala Asp Pro Ala Thr Leu Ser Glu Asp Glu Ala Arg

35 40 45

Leu Leu Leu Ala Ala Leu Val Gln Asp Tyr Val Gln Met Lys Ala Ser

50 55 60

Glu Leu Glu Gln Glu Gln Glu Arg Glu Gly Ser Arg Ile Ile Ala Gln

65 70 75 80

Lys Arg Ala Cys Asp Thr Ala Thr Cys Val Thr His Arg Leu Ala Gly

85 90 95

Leu Leu Ser Arg Ser Gly Gly Val Val Lys Asn Asn Phe Val Pro Thr

100 105 110

Asn Val Gly Ser Lys Ala Phe Gly Arg Arg Arg Arg Asp Leu Gln Ala

115 120 125

<210> 35

<211> 141

<212> PRT

<213> Homo sapiens

<400> 35

Met Gly Phe Gln Lys Phe Ser Pro Phe Leu Ala Leu Ser Ile Leu Val

1 5 10 15

Leu Leu Gln Ala Gly Ser Leu His Ala Ala Pro Phe Arg Ser Ala Leu

20 25 30

Glu Ser Ser Pro Ala Asp Pro Ala Thr Leu Ser Glu Asp Glu Ala Arg

35 40 45

Leu Leu Leu Ala Ala Leu Val Gln Asp Tyr Val Gln Met Lys Ala Ser

50 55 60

Glu Leu Glu Gln Glu Gln Glu Arg Glu Gly Ser Ser Leu Asp Ser Pro

65 70 75 80

Arg Ser Lys Arg Cys Gly Asn Leu Ser Thr Cys Met Leu Gly Thr Tyr

85 90 95

Thr Gln Asp Phe Asn Lys Phe His Thr Phe Pro Gln Thr Ala Ile Gly

100 105 110

Val Gly Ala Pro Gly Lys Lys Arg Asp Met Ser Ser Asp Leu Glu Arg

115 120 125

Asp His Arg Pro His Val Ser Met Pro Gln Asn Ala Asn

130 135 140

<210> 36

<211> 116

<212> PRT

<213> Homo sapiens

<400> 36

Ala Pro Phe Arg Ser Ala Leu Glu Ser Ser Pro Ala Asp Pro Ala Thr

1 5 10 15

Leu Ser Glu Asp Glu Ala Arg Leu Leu Leu Ala Ala Leu Val Gln Asp

20 25 30

Tyr Val Gln Met Lys Ala Ser Glu Leu Glu Gln Glu Gln Glu Arg Glu

35 40 45

Gly Ser Ser Leu Asp Ser Pro Arg Ser Lys Arg Cys Gly Asn Leu Ser

50 55 60

Thr Cys Met Leu Gly Thr Tyr Thr Gln Asp Phe Asn Lys Phe His Thr

65 70 75 80

Phe Pro Gln Thr Ala Ile Gly Val Gly Ala Pro Gly Lys Lys Arg Asp

85 90 95

Met Ser Ser Asp Leu Glu Arg Asp His Arg Pro His Val Ser Met Pro

100 105 110

Gln Asn Ala Asn

115

<210> 37

<211> 187

<212> PRT

<213> Homo sapiens

<400> 37

Thr Ser Glu Glu Thr Ile Ser Thr Val Gln Glu Lys Gln Gln Asn Ile

1 5 10 15

Ser Pro Leu Val Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile

20 25 30

Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys

35 40 45

Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg

50 55 60

Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu

65 70 75 80

Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe

85 90 95

Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met

100 105 110

Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu

115 120 125

Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly

130 135 140

Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp

145 150 155 160

Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His

165 170 175

Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly

180 185

<210> 38

<211> 168

<212> PRT

<213> Homo sapiens

<400> 38

Val Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr

1 5 10 15

Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys

20 25 30

Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His

35 40 45

Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His

50 55 60

Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln

65 70 75 80

Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr

85 90 95

Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser

100 105 110

Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser

115 120 125

Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe

130 135 140

Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser

145 150 155 160

Phe Phe Gly Ala Phe Leu Val Gly

165

<---

1. Способ определения бактериальной инфекции на основании биологических данных, содержащих значения экспрессии множества полипептидов в крови субъекта, где значения экспрессии вводят в память аппаратного обрабатывающего устройства, при этом способ включает:

использование аппаратного обрабатывающего устройства для выполнения компьютерных программных инструкций, хранимых на машиночитаемом носителе, при этом указанные компьютерные программные инструкции включают:

компьютерные программные инструкции для вычисления расстояния d между сегментом SROI кривой S и осью π, образованной направлением, при этом указанное расстояние d, вычисляемое, перпендикулярно указанной оси π, между точкой Р на указанной оси π и соответствующей точкой на указанной кривой, при этом указанные точки образованы координатой δ1 вдоль указанного направления; и

компьютерные программные инструкции для коррелирования указанного расстояния d с присутствием, отсутствием или вероятностью того, что субъект имеет бактериальную инфекцию, и для генерирования на графическом пользовательском интерфейсе выходных данных указанного присутствия, отсутствия или вероятности, при этом если указанное расстояние d выше предварительно определенного уровня ωB, то указанные компьютерные программные инструкции определяют, что субъект вероятно имеет бактериальную инфекцию;

при этом указанная координата δ1 образована комбинацией указанных значений экспрессии, причем указанная комбинация включает линейную комбинацию указанных значений экспрессии, при этом по меньшей мере 90% указанного сегмента заключено между нижней ограничивающей прямой f(δ1)-ε0 и верхней ограничивающей прямой f(δ1)+ε1, при этом указанный f(δ1) равняется 1/(1+exp(δ1)), и при этом каждый из указанных ε0 и ε1 составляет менее 0,5.

2. Способ по п. 1, в котором указанные значения экспрессии измеряют с помощью измерительной системы, выполняющей по меньшей мере один вид автоматизированного анализа, выбранный из группы, состоящей из автоматизированного анализа ELISA, автоматизированного иммуноанализа и автоматизированного функционального анализа, при этом способ включает получение указанных биологических данных от указанной измерительной системы.

3. Способ по п. 1, дополнительно включающий получение указанной вероятности на основе указанного расстояния d, сравнение указанной вероятности с предварительно определенным пороговым значением и лечение указанной бактериальной инфекции у субъекта, если указанная вероятность превышает указанное предварительно определенное пороговое значение.

4. Способ определения бактериальной инфекции на основании биологических данных содержащих значения экспрессии множества полипептидов в крови субъекта, где значения экспрессии вводят в память аппаратного обрабатывающего устройства, при этом способ включает:

использование аппаратного обрабатывающего устройства для выполнения компьютерных программных инструкций, хранимых на машиночитаемом носителе, при этом указанные компьютерные программные инструкции включают:

компьютерные программные инструкции для вычисления первого расстояния d между сегментом SROI кривой поверхности S и плоскостью π, образованной первым направлением и вторым направлением, при этом указанное первое расстояние d вычисляют, перпендикулярно указанной плоскости π, между точкой Р на указанной плоскости π и соответствующей точкой на указанной поверхности S, причем указанная точка образованна первой координатой δ0 вдоль указанного первого направления и второй координатой δ1 вдоль указанного второго направления; и

компьютерные программные инструкции для коррелирования указанного первого расстояния d с присутствием, отсутствием или вероятностью того, что субъект имеет бактериальную инфекцию, и для генерирования на графическом пользовательском интерфейсе выходных данных указанного присутствия, отсутствия или вероятности, причем когда указанное первое расстояние d выше предварительно определенного уровня ωB, то указанные компьютерные программные инструкции определяют, что субъект вероятно имеет бактериальную инфекцию;

при этом каждая из указанной первой координаты δ0 и указанной второй координаты δ1 образована различной комбинацией указанных значений экспрессии причем каждая комбинация включает линейную комбинацию указанных значений экспрессии, при этом по меньшей мере 90% указанного сегмента заключено между нижней ограничивающей поверхностью f(δ01)-ε0 и верхней ограничивающей поверхностью f(δ01)+ε1, при этом указанная f(δ01) равняется exp(δ1)/(1+exp(δ0)+exp(δ1)), и при этом каждый из указанных ε0 и ε1 составляет менее 0,5.

5. Способ по п. 4, в котором указанные значения экспрессии измеряют с помощью измерительной системы, выполняющей по меньшей мере один вид автоматизированного анализа, выбранный из группы, состоящей из автоматизированного анализа ELISA, автоматизированного иммуноанализа и автоматизированного функционального анализа, при этом способ включает получение указанных биологических данных от указанной измерительной системы.

6. Способ по п. 4, дополнительно включающий получение указанной вероятности на основе указанного первого расстояния d, сравнение указанной вероятности с предварительно определенным пороговым значением и лечение указанной бактериальной инфекции у субъекта, если указанная вероятность превышает указанное предварительно определенное пороговое значение.

7. Способ по п. 4, дополнительно включающий вычисление второго расстояния между сегментом второй кривой поверхности и указанной плоскости, причем указанное второе расстояние перпендикулярно указанной плоскости π, между указанной точкой Р на указанной плоскости π и в соответствующей точке на указанной второй кривой поверхности; и

определение корреляции указанного второго расстояния с присутствием, отсутствием или вероятностью того, что субъект имеет вирусную инфекцию, причем когда указанное второе расстояние выше предварительно определенного уровня ωv, то указанные компьютерные программные инструкции определяют, что субъект вероятно имеет вирусную инфекцию;

при этом по меньшей мере 90% указанного сегмента указанной второй поверхности заключено между второй нижней ограничивающей поверхностью g(δ01)-ε2 и второй верхней ограничивающей поверхностью g(δ01)+ε3, при этом указанная g(δ01) равняется exp(δ0)/(1+exp(δ0)+exp(δ1)), и при этом каждый из ε2 и ε3 составляет менее 0,5.

8. Способ по п. 7, дополнительно включающий получение указанной вероятности на основе указанного второго расстояния, сравнение указанной вероятности со вторым предварительно определенным пороговым значением и лечение у субъекта указанной вирусной инфекции, если указанная вероятность превышает указанное второе предварительно определенное пороговое значение.

9. Способ по п. 7, дополнительно включающий получение указанной вероятности того, что субъект имеет бактериальную инфекцию, на основе указанного первого расстояния d, получение указанной вероятности того, что субъект имеет вирусную инфекцию, на основе указанного второго расстояния, сравнение каждой из указанных вероятностей с соответствующим предварительно определенным пороговым значением и, если каждая из указанных вероятностей находится ниже указанного соответствующего предварительно определенного порогового значения, определение того, что пациент, вероятно, имеет неинфекционное заболевание.

10. Способ по любому из пп. 1-9, в котором каждое из указанных множеств полипептидов выбрано из группы, состоящей из CRP, IP-10, TRAIL, IL1ra, РСТ и SAA.

11. Способ по любому из пп. 1-9, в котором указанное множество полипептидов включает по меньшей мере три полипептида.

12. Способ по любому из пп. 1-9, в котором указанное множество полипептидов включает по меньшей мере три полипептида, выбранных из группы, состоящей из CRP, IP-10, TRAIL, IL1ra, РСТ и SAA

13. Способ по любому из пп. 1-9, в котором указанное множество полипептидов включает по меньшей мере CRP и TRAIL.

14. Способ по любому из пп. 1-9, в котором указанное множество полипептидов включает по меньшей мере CRP, TRAIL и IP-10

15. Способ по любому из пп. 1-9, дополнительно включающий генерирование выходных данных по указанной вероятности, при этом указанные выходные данные представлены графически.

16. Способ по любому из пп. 1-9, дополнительно включающий определение указанных значений экспрессии, и при этом по меньшей мере одно из указанных значений экспрессии определяется с помощью электрофореза или иммунохимического анализа.

17. Машиночитаемый носитель данных, на котором хранятся программные инструкции, которые при чтении аппаратным обрабатывающим устройством заставляют аппаратное обрабатывающее устройство получать значения экспрессии множества полипептидов в крови субъекта, который имеет неизвестное заболевание, и выполнять способ по любому из пп. 1, 2, 4, 5, 7 и 9.



 

Похожие патенты:
Наверх