Способ поиска белков-мишеней, запускающих процесс канцерогенеза, в образцах тканей индивидуального пациента, для последующей противоопухолевой фармакотерапии

Авторы патента:

КОТЕЛЬНИКОВА Екатерина Александровна (RU)

ПЯТНИЦКИЙ Михаил Алексеевич (RU)

C12Q1/68 - использующие нуклеиновые кислоты

Владельцы патента RU 2577107:

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Московский государственный университет имени М.В. Ломоносова" (МГУ) (RU)

Изобретение относится к области биотехнологии, а именно к способу поиска белков-мишеней, запускающих процесс канцерогенеза, в образцах тканей индивидуального пациента, для последующей противоопухолевой фармакотерапии. Определяют методом секвенирования транскриптомные данные об уровнях экспрессии генов в образцах. Получают набор активированных генно-регуляторных сетей, состоящих из центрального гена регулятора и регулируемых им генов. Определяют из транскриптомных данных дифференциально экспрессированные гены. Определяют методами секвенирования изменения в последовательностях ДНК, представленных в виде набора однонуклеотидных полиморфизмов в образцах. Определяют среди найденных генетических вариантов гены-драйверы. Проводят поиск канонических сигнальных путей, значимо обогащенных ранее найденными центральными генами регуляторами экспрессии, дифференциально экспрессированными генами, генами с идентифицированными однонуклеотидными полиморфизмами и инделами, генами-драйверами. Проводят поиск методом перебора в составе идентифицированных сигнальных путей существующих белков-мишеней для лекарственных препаратов, предназначенных для противоопухолевой терапии. Предложенное изобретение позволяет с высокой эффективностью найти белки-мишени, запускающие процесс канцерогенеза, в образцах тканей индивидуального пациента. 1 ил., 5 табл.

Область техники

Изобретение относится к области биотехнологии и персонализированной медицины. Объект заявки представляет собой способ идентификации активированных сигнальных путей (молекулярных механизмов) специфичных для развития определенного подтипа онкологических заболеваний у индивидуального пациента. Для этого используются данные о последовательности ДНК (экзом) и уровне экспрессии генов (транскриптом) для образцов нормальной ткани и ткани опухоли. В частности, изобретение позволяет генерировать персонализированные рекомендации для оптимизации схем противоопухолевой фармакотерапии и может быть использовано в медицине.

Уровень техники

Ключевой тенденцией в современном лечении онкологических заболеваний является то, что постановка диагноза, прогнозирование течения заболевания, оценки риска и ответа на терапию могут быть значительно улучшены путем стратификации пациентов на основании геномных, транскриптомных и эпигеномных характеристик опухоли. Под стратификацией подразумевается разделение пациентов на подгруппы объединенные общими активированными молекулярными механизмами, ответственными за развитие заболевания. При этом для каждой отдельной подгруппы пациентов со специфическим молекулярным механизмом онкогенеза может применяться специфическая лекарственная терапия. Такая персонализированная терапия может быть более эффективной по сравнению со стандартной схемой, т.к. учитывает специфику заболевания у отдельного пациента.

Особый интерес представляют методы, позволяющие при стратификации пациентов одновременно учесть различные типы данных, характеризующие молекулярные свойства опухоли, в частности - объединить данные о копийностях генов, имеющихся соматических мутациях и степени экспрессии соответствующих мРНК. Другим желательным свойством методов стратификации пациентов является интегрирование с существующим биологическим знанием, представленным в виде набора генных онтологий, сигнальных путей, а также сетей межгенных и межбелковых взаимодействий. Под интегрированием понимается учет и использование при поиске активированных молекулярных механизмов онкогенеза известной биологической информации хранящейся в различных базах данных, таких как Gene Onthology, KEGG, Wiki Pathways, DrugBank, Reactome, PharmGKB и подобных ресурсах. Данная область является относительно новой, но активно развивается в последнее время.

К настоящему моменту разработано несколько способов использования информации об уровне экспрессии и последовательностях генов для стратификации пациентов (Bennett В.D., Xiong Q., Mukherjee S. and Furey Т. S.A predictive framework for integrating disparate genomic data types using sample-specific gene set enrichment analysis and multi-task learning (2012) PLoS One 7, e44635; Ng S., Collisson E.A., Sokolov A., Goldstein Т., Gonzalez-Perez A., Lopez-Bigas N., Benz C., Haussler D, and Stuart J.M. PARADIGM-SHIFT predicts the function of mutations in multiple cancers using pathway impact analysis (2012) Bioinformatics 28, i640-i646; Xiong Q., Ancona N., Hauser E.R., Mukherjee S. and Furey T.S. Integrating genetic and gene expression evidence into genome-wide association analysis of gene sets (2012) Genome Res 22, 386-397). Однако ни в одном из указанных методов не сочетаются анализ активированных генных сетей с объединением экзомных и транскриптомных данных на уровне отдельного пациента.

Из остальных методов наиболее близок к патентуемому изобретению метод iCluster + (Мо Q., Wang S., Seshan V.Е., Olshen А.В., Schultz N., Sander С., Powers R.S., Ladanyi M. and Shen R. Pattern discovery and cancer gene identification in integrated cancer genomic data (2013) Proc Natl Acad Sci USA 110, 4245-4250). Авторами разработан единый математический аппарат, основанный на регрессионном и факторном анализе, и позволяющий объединить множество разнообразных типов данных. Так наличие мутации в каждом гене моделируется как бинарная переменная, что позволяет использовать метод логистической регрессии. Данные о копийностях генов трактуются в категориальной шкале, и для их анализа применяется мультиномиальная логит-модель. Наконец количество прочтений мРНК полученных методом RNASeq обрабатывается пуассоновской регрессией. Построенная модель оптимизируется путем отбора значимых переменных. Наибольший интерес представляют кластер-специфичные гены, характеризующие тот или иной молекулярный механизм. Однако для метода не разработана валидация построенной модели, большое число параметров значительно увеличивает риск чрезмерной подстройки модели под данные (переобучение), а найденным скрытым (латентным) переменным не дается какая-либо биологическая интерпретация. Также в методе не используется априорное биологическое знание (канонические сигнальные пути).

Из других методов можно упомянуть алгоритм PARADIGM (Ng S., Collisson E.A., Sokolov A., Goldstein Т., Gonzalez-Perez A., Lopes-Bigas N., Benz C., Haussler D. and Stuart J.M. PARADIGM-SHIFT predicts the function of mutations in multiple cancers using pathway impact analysis (2012) Bioinformatics 28, i640-i646; Vaske C.J., Benz S.C., Sanborn J.Z., Earl D., Szeto C., Zhy J., Haussler D. and Stuart J.M. Inference of patient-specific pathway activities from multi-dimensional cancer genomics data using PARADIGM (2010) Bioinformatics 26, i237-245), который интегрирует данные о копийностях генов с транскриптомным анализом, используя обширную коллекцию сигнальных путей NCI PID (Schaefer С.F., Anthony K., Krupa S., Buchoff J., Day M., Hannay Т. and Buetow K.H. PID: the Pathway Interaction Database (2009) Nucleic Acids Res 37, D674-679). Каждый сигнальный путь конвертируется в вероятностную модель (факторный граф), где моделируются регуляции транскрипции и трансляции. Аналогично методу максимального правдоподобия для каждого гена оценивается мера его активности при условии имеющихся данных. Полученная матрица активностей генов используется для проведения иерархического кластерного анализа пациентов. Найденные группы пациентов показывают достоверное различие в выживаемости. Однако в указанном методе не учитываются известные соматические мутации (экзомные данные), а для применения метода требуется значительная выборка пациентов, что ограничивает его применение на практике.

В большинстве других алгоритмов предложенных для стратификации пациентов (патенты ЕР 2297359 A1, US 20120252856 A1, 2473555 С2) предлагается использовать заранее зафиксированный набор генов либо входящих в общий сигнальный путь, либо отобранных в результате независимого поиска биомаркеров и не учитывающих известные белок-белковые взаимодействия. Это не позволяет идентифицировать случаи, когда у индивидуального пациента активирован другой регуляторный каскад, ответственный за развитие опухоли и не входящий в априорно заданный набор генов. Соответственно подход с фиксированным набором генов не может учесть протекание заболевания в каждом отдельном случае. Такие наборы генов представляют собой потенциальные многомерные биомаркеры, идентифицированные с помощью различных процедур статистического анализа транскриптомных данных, включая методы распознавания образов. Однако несмотря на проделанный объем работ в данной области, большинство найденных таким способом биомаркеров было невоспроизводимо в независимых исследованиях, а клиническая значимость была продемонстрирована для единичных наборов биомаркеров. Причинами слабой воспроизводимости результатов являются значительные статистические трудности при обработке данных характеризующимися десятками тысяч переменных (т.н. 'проклятие размерности') и наличие существенной биологической вариабельности между образцами.

Актуальность изобретения

Популяции клеток опухоли чрезвычайно гетерогенны как в морфологических, так и в функциональных аспектах, а соответствующие молекулярные механизмы ответственные за прогрессирование опухоли очень разнообразны. Поэтому одной из важнейших проблем современной онкологии является разработка персонализированного подхода к таргетной (целенаправленной) терапии опухолей, заключающегося в учете индивидуальных особенностей молекулярного профиля конкретного новообразования. Воздействие на специфические для опухоли нарушения в активности сигнальных каскадов все чаще рассматривается как основная причина эффективности ее ответа на ту или иную схему направленной терапии. Также важность персонифицированного подхода к выбору таргетной химиотерапии обусловлена высокой стоимостью и высокой токсичностью противоопухолевых препаратов. При этом ошибка в определении специфической терапии может выявиться только через несколько месяцев, когда прогрессирование опухоли вследствие неэффективной терапии приведет к необратимым последствиям. Резюмируя, можно заключить, что в области оптимизации схем лечения онкологических заболеваний как нигде справедлив подход "лечить больного, а не болезнь".

За последнее десятилетие существенный прогресс в области изучения молекулярных особенностей злокачественных клеток достигнут благодаря интенсивному развитию высокопроизводительных методов геномного секвенирования (Next-Generation Sequencing, NGS). Снижение стоимости технологий детектирования однонуклеотидных полиморфизмов (Single Nucleotide Polymorphism, SNP) и определения уровней экспрессии всей совокупности мРНК транскриптома (технология RNASeq) позволило проводить крупномасштабные международные проекты для получения информации о генетических профилях различных видов раковых заболеваний.

В то же время до сих пор не разработаны устоявшиеся алгоритмы и подходы по интеграции массивов различных типов NGS-данных с целью их биологического осмысления с точки зрения накопленных знаний о взаимодействии и регуляции генов и белков. Это сильно затрудняет клиническое применение результатов проведенных геномных и транскриптомных анализов. Для определения дерегулированных сигнальных каскадов и соответственно индивидуального подбора терапии необходимо разработать метод по наложению имеющихся результатов экзомного и транскриптомного анализа на заранее сформированные экспертом сигнальные каскады (pathways), биологические сети и генные сигнатуры.

Раскрытие изобретения

Разработанная методика представляет собой способ анализа данных о соматических мутациях и экспрессии генов для идентификации белков-мишеней в составе активированных сигнальных путей специфичных для развития определенного подтипа онкологических заболеваний у индивидуального пациента и генерации персонализированных рекомендаций для оптимизации схем противоопухолевой фармакотерапии.

Данные об экспрессии генов могут быть получены с помощью различных технологий. Наиболее распространены два подхода - метод биочипов (microarray) и метод RNASeq, представляющий собой секвенирование следующего поколения (NGS) и основанный на прямом прочтении последовательности нуклеотидов в молекулах дезоксирибонуклеиновых кислот.

Отличие предлагаемого подхода от известных методов состоит в том, что идентификация активированных сигнальных путей проводится для каждого образца (пациента) индивидуально, т.е. набор потенциальных биомаркеров заранее не зафиксирован, а определяется 'на лету'. Также важной особенностью патентуемого подхода является ориентация на поиск именно регуляторных межгенных взаимодействий, а не набора дифференциально экспрессированных генов. Многие регуляторы входят в состав сигнальных путей и могут служить указанием на молекулярный механизм специфического подтипа заболевания. При этом уровень экспрессии самого регулятора часто меняется незначительно, что не позволяет выявить его при помощи стандартных методов поиска дифференциально экспрессируемых генов. Наконец в предлагаемом подходе предлагается способ интегрирования транскриптомных и экзомных данных путем проецирования их на известные сигнальные каскады. Для этого производится поиск сигнальных каскадов статистически достоверно обогащенных генами/белками, полученными в результате анализа данных по экспрессии и последовательностей ДНК. Изучение указанных сигнальных каскадов экспертом-биологом дает возможность построить модель развития заболевания для индивидуального пациента, а изучение состава найденных значимых сигнальных каскадов на предмет известных белков-мишеней дает возможность предложить персонализированную оптимальную противоопухолевую терапию.

Для решения заявленной задачи были использованы методы поиска активированных генных регуляторных сетей по транскриптомным данным. Генная сеть в простейшем случае состоит из центрального регулятора (в частности, транскрипционного фактора) и генов, чья экспрессия зависит от указанного регулятора. Важным свойством генной регуляторной сети является то, что экспрессия всех генов скоординировано реагирует на изменение состояния, например, при сравнении опухоль - норма. Распределение логарифмов величин отношения экспрессии в опухоли по отношению к норме (log-ratio) для генов, контролируемых центральным регулятором, должно статистически достоверно отличаться от фонового распределения, построенного для всех генов, измеренных в эксперименте. Для поиска активированных генных регуляторных сетей предлагается использовать алгоритм SNEA, Subnetwork Enrichment Analysis (Sivachenko A.Y., Yuryev A., Daraselia N. and Mazo I. Molecular networks in microarray analysis (2007) J Bioinform Comput Biol 5, 429-456), однако возможны и другие алгоритмы поиска активированных генов-регуляторов, т.н. upstream regulators. Пример генной сети представлен на рисунке (фиг. 1), где цветом указан относительный уровень экспресии гена в опухоли по сравнению с нормой. В этом случае регулятор экспрессии - транскрипционный фактор HNF4G имеет пониженную экспрессию в опухоли, однако регулируемые им гены (в частности, АРОА1, PKLR, CYP3A4) показывают значительно более выраженное изменение в экспрессии. Таким образом, наблюдаемое изменение экспрессии указанных генов можно объяснить понижением экспрессии самого транскрипционного фактора - регулятора.

Поиск регуляторов, обуславливающих изменение экспрессии генов, играет важную роль при анализе молекулярных механизмов рака. Большинство онкогенов и опухолевых супрессоров как раз являются регуляторами генной экспрессии и играют ключевую роль в процессах туморогенеза, несмотря на то, что не являются наиболее дифференциально экспрессированными генами.

В качестве исходных данных о межгенной регуляции используется биологическая сеть (граф) ResNet, выпускаемая компанией Elsevier. Ее особенность заключается в том, что узлы графа - всевозможные классы молекулярно-биологических сущностей (белок, ген, малая молекула, функциональный класс, клеточный процесс, комплекс, т.д.) - связаны между собой различными типами ребер, включая регуляторные (регуляция транскрипции) и физические межгенные/межбелковые взаимодействия. Важно отметить, что сеть ResNet построена с помощью методик компьютерной обработки естественного языка (Natural Language Processing, NLP) и описывает более чем 1500000 взаимодействий полученных при анализе более чем 22000000 резюме и 880000 полных текстов статей по медико-биологической тематике. Поскольку в биологической сети Resnet представлены различные типы сущностей, то при поиске активированных регуляторных сетей при помощи алгоритма SNEA в качестве регулятора может выступать другая сущность, которая не измеряется в эксперименте, например группа генов/белков (функциональный класс), клеточный процесс и т.д.

Полученные транскриптомные данные анализируются на предмет выявления дифференциально экспрессированных генов, т.е. генов, которые статистически значимо изменили свою экспрессию в образце опухоли по сравнению с нормой. Для этого может использоваться любой алгоритм для анализа транскриптомных данных, такой, например, как edgeR (Dimont Е., Shi J., Kirchner R., Hide W., edgeRun: an R package for sensitive, functionally relevant differential expression discovery using an unconditional exact test. Bioinformatics. 2015 Aug l;31(15:2589-90. doi: 10.1093/bioinformatics/btv209. Epub 2015 Apr 21) или DESeq (Anders S., Huber W. Differential expression analysis for sequence count data. GenomeBiol. 2010; 11(10):R106. doi: 10.1186/gb-2010-11-10-r106. Epub 2010 Oct. 27).

Далее обрабатываются данные по соматическим мутациям. Анализ последовательности генома (экзома) пациента дает дополнительный уровень понимания функционирования молекулярных механизмов, ответственных за развитие опухоли. Для этого используется коллекция известных канонических сигнальных путей. Такая коллекция может быть собрана из открытых источников (базы данных KEGG http://www.genome.jp/kegg/, Reactome http://www.reactome.org/, WikiPathways http://www.wikipathways.org/index.php/WikiPathways, PID http://pid.nci.nih.gov/), так и дополнена сигнальными путями, специально созданными для этой цели экспертами-биологами. Каждый сигнальный путь представляет собой набор функционально родственных генов, связанных регуляторными соотношениями и/или белок-белковыми взаимодействиями. Среди такой коллекции известных канонических сигнальных путей отбираются сигнальные пути, которые достоверно обогащены рядом "важных" генов. К таким "важным" генам относятся ранее найденные регуляторы экспрессии, дифференциально экспрессированные гены, гены с идентифицированными соматическими мутациями (полученные, например, из базы данных COSMIC, http://cancer.sanger.ac.uk/cancergenome/projects/cosmic/), гены-драйверы для которых известна из научной литературы их связь с онкологическими заболеваниями (Krishnan V.G. and Ng Р.С. Predicting cancer drivers: are we there yet? (2012) Genome Med 4, 88).

Для отбора сигнальных путей обогащенных "важными" генами используется известный из уровня техники статистический метод - точный тест Фишера (Rivals I., Personnaz L., Taing L. and Potier, M.C. Enrichment or depletion of a GO category within a class of genes: which test? (2007) Bioinformatics 23, 401-407), причем сигнальный путь считается достоверно обогащенным, если вычисленное значение уровня значимости не превышает величины 0,05.

Таким образом, определяются сигнальные пути, активированные у индивидуального пациента и играющие потенциально значимую роль в прогрессе заболевания. Эта информация затем может быть использована экспертом-биологом для построения персонализированной модели туморогенеза, а также использована для поиска лекарственных препаратов, мишенью которых являются найденные белки.

Таким образом, интеграция экзомных и транскриптомных данных производится на уровне канонических сигнальных путей, активированных у данного пациента.

Помимо поиска сигнальных путей, обогащенных регуляторами генной экспрессии, возможно проведение поиска сигнальных путей, на которых перепредставлены дифференциально экспрессирующиеся гены (также с помощью точного теста Фишера), которые являются потенциальными биомаркерами прогресса опухоли. Измеряя изменение экспрессии таких биомаркеров, а также взаимодействующих белков, возможно контролирование эффективности применяемой фармакотерапии.

Идентифицированные на предыдущем этапе сигнальные пути анализируются на предмет наличия в их составе белков-мишеней для лекарственных препаратов, предназначенных для противоопухолевой терапии, известных из литературных источников. Используя информацию о существующих лекарственных препаратах и их белках-мишенях, а также о составе найденных активированных канонических сигнальных путей, генерируются персонализированные рекомендации по оптимизации противоопухолевой фармакотерапии. Для этого проводится поиск в существующих базах данных (в частности, база DrugBank) информации о лекарственных препаратах и их мишенях на предмет присутствия белков, содержащихся в идентифицированных сигнальных путях, а именно - если белок-мишень для какого-либо лекарственного препарата, предназначенного для противоопухолевой терапии, входит в состав идентифицированного сигнального пути, то такой препарат рекомендуется пациенту для проведения химиотерапии.

Дополнительно возможен учет наличия у пациента полиморфизмов, для которых показана их связь с чувствительностью к определенному препарату. Для этого проводится поиск в существующих базах данных по фармакогеномике (в частности, база PharmGKB) на предмет присутствия аннотированных однонуклеотидных полимофизмов (SNP), для которых экспериментально установлена взаимосвязь между наличием данного SNP с и чувствительностью к терапии указанным фармакологическим препаратом.

Таким образом, удается объединить экспертное знание относительно известных межгенных и межбелковых регуляторных взаимодействиях (канонические сигнальные каскады) с индивидуальными особенностями развития опухоли как на уровне экзома (поиск регуляторов и сигнальных путей значимо обогащенных функциональными SNP), так и на уровне транскриптома (активированные генно-регуляторные сети определяются "на лету" отдельно для каждого пациента).

Найденные списки задействованных сигнальных путей, являющиеся результатом анализа индивидуального экзома и транскриптома, представляют значительный интерес при последующем экспертно-биологическом анализе. Отталкиваясь от найденных сигнальных путей и соответствующих межгенных и межбелковых регуляторных и других взаимодействий, эксперт-биолог может создать персонализированную модель развития онкологического заболевания в отдельном индивидууме и, соответственно, дать рекомендации относительно оптимальной противоопухолевой фармакотерапии.

Краткое описание чертежей

На фиг. 1 приведен пример активированной генной сети. Интенсивностью цвета закодировано изменение экспрессии в опухоли по сравнению с нормой. Незначительное изменение экспрессии регулятора (транскрипционного фактора HNF4G) приводит к существенному изменению экспрессии регулируемых им генов: АРОА1, PKLR, CYP3A4 и других генов.

Осуществление изобретения

Исходными данными являются набор транскриптомных данных и информация о соматических мутациях, представленная в виде набора однонуклеотидных полиморфизмов (SNP) или инделов. Экзомные и транскриптомные данные должны быть получены как для образца опухоли, так и для образца исходной (здоровой) ткани. Для экспертного анализа необходимо использование набора сигнальных каскадов (pathways), созданных специально для изучаемого онкологического заболевания и/или полученных из внешних источников. В качестве внешних источников сигнальных путей могут выступать базы KEGG, Reactome, Wikipathways и другие. Предпочтительно, чтобы наборы сигнальных путей были загружены в специализированный программный продукт, например Pathway Studio (Elsevier), IPA (Ingenuity Systems) или аналоги.

Продемонстрируем осуществление изобретения на примере.

Были получены образцы опухоли и здоровой ткани больного, страдающего от гепатоцеллюлярной карциномы невирусной этиологии. Было предложено провести анализ согласно данному описанию изобретения с целью подобрать максимально эффективную химиотерапию именно для указанного больного.

Биопсия была проведена во время операции по частичному хирургическому удалению опухоли. Доля содержания опухолевых клеток составила 80%. Парные образцы норма/опухоль были проанализированы методом секвенирования следующего поколения на секвенаторе Illumina HiSeq2000. Были получены как данные экзомного секвенирования, так и данные по экспрессии генов. Длина прочтения составила 100 нуклеотидов. Количество прочтений для ДНК в нормальной и опухолевой ткани составило 127243260 и 237545808 соответственно. Количество прочтений для РНК в нормальной и опухолевой ткани составило 83546978 и 107422142 соответственно.

На первом этапе анализировались данные по экспрессии генов. В таблице 1 приведена часть полученных данных.

Полученные транскриптомные данные были использованы для поиска активированных генных регуляторных сетей с помощью алгоритма SNEA, Subnetwork Enrichment Analysis (Sivachenko et al., 2007). Всего было идентифицировано 23 регулятора. На следующей таблице приведена часть найденных генно-регуляторных сетей, состоящих из центрального регулятора и регулируемых им генов (табл. 2).

Далее с помощью алгоритма DEseq были проанализированы транскриптомные данные на предмет выявления дифференциально экспрессированных генов. Для этого использовали алгоритм DESeq (Anders&Huber, 2010). Всего было выявлено 314 таких генов, включая гены TGFA, SRC, IGF1, FOS, TGFB1, NRG1, CDK1, AREG, ID1, SPP1, АРОА1, SMAD3, MKI67, SMAD7.

Были проанализированы данные по экзомному секвенированию. Было выявлено 39 соматических несинонимических мутаций, из которых 36 мутаций представляли собой замены, две мутации являлись инсерциями и одна мутация представляла собой делецию.

Среди выявленных мутаций были предсказаны потенциальные гены-драйверы онкогенеза согласно алгоритму CHASM (Carter et al., 2009). Всего было предсказано три гена: ROR2, RPS6KA5 и NRAS.

Была создана коллекция канонических сигнальных путей, которая включала в себя данные из открытых баз данных KEGG http://www.genome.jp/kegg, Reactome http://www.reactome.org, WikiPathways http://www.wikipathways.org и PID http://pid.nci.nih.gov. Дополнительно был создан сигнальный путь, отражающий особенности функционирования EGFR-каскада в гепатоцеллюлярной карциноме. Всего в коллекцию было включено 314 сигнальных каскада.

Среди сигнальных каскадов из коллекции был проведен поиск сигнальных путей, значимо обогащенных несколькими категориями "важных" генов, а именно:

1) идентифицированными регуляторами генной экспрессии с помощью алгоритма SNEA;

2) генами с идентифицированными однонуклеотидными полиморфизмами и/или вставками/заменами, т.е. несинонимичными мутациями;

3) генами, показывающими дифференциальную экспрессию между опухолевой и здоровой тканью;

4) генами-"драйверами" опухолевого процесса согласно предсказанию веб-сервера CHASM (Carter Н., Chen S., Isik L., Tyekucheva S., Velculescu V.E., Kinzler K.W., Vogelstein В. and Karchin R. Cancer-specific high-throughput annotation of somatic mutation: computational prediction of driver missense mutations (2009) Cancer Res 69, 6660-6667).

Оценка значимости обогащения сигнального пути проводилась с помощью точного теста Фишера (Rivals et al., 2007), причем сигнальный путь считался значимо обогащенным, если вычисленное значение уровня значимости не превышает величины 0,05.

Приведем пример вычисления значимости обогащения сигнального пути генами, в которых были обнаружены соматические мутации. Всего таких генов было выявлено 39. Рассмотрим сигнальный каскад BDNF signaling pathway [source:Wikipathways], в который входит 140 генов. Составляется таблица, где определяется мера перекрывания сигнального каскада и генов с соматическими мутациями (табл. 3). Например, только один ген (RPS6KA5) одновременно входит в сигнальный каскад BDNF signaling pathway [source:Wikipathways] и мутирован в образце ткани пациента, в то время как среди остальных 139 генов каскада мутаций выявлено не было.

Далее согласно точному теста Фишера вычисляется уровень значимости p по формуле

где n=a+b+c+d - общее количество генов. В данном случае значение p равно 0,238. Эта величина меньше общепринятого порога 0,05, а следовательно, данный сигнальный путь не будет считаться значимо обогащенным.

Ниже приведены (табл. 4) результаты поиска значимо обогащенных сигнальных путей.

Как следует из таблицы, в исследуемом пациенте активны сигнальные пути WNT signaling, EGFR signaling, и р38-МАРК signalling. Был проведен поиск в базах данных DrugBank и PharmGKB на предмет того, существуют ли известные белки-мишени, которые входят в состав указанных сигнальных путей. В таблице 5 приведены лекарственные препараты и их белки-мишени, входящие в состав указанных сигнальных путей.

На сегодняшний момент лекарственные препараты, ингибирующие сигнальный каскад WNT (например, Vantictumab, OTSA101 и OMP-54F28), пока находятся в первой фазе клинических испытаний (Blagodatski et al., 2014). В то же время для сигнального каскада EGFR signalling существует ряд активно использующихся в клинике препаратов, а именно такие лекарственные средства как гефитиниб и эрлотиниб (Dienstmann R., De Dosso S., Felip E. and Tabernero J., Drug development to overcome resistance to EGFR inhibitors in lung and colorectal cancer. Mol Oncol. 2012 Feb; 6(1): 15-26. doi:10.1016/j.molonc.2011.11.009. Epub 2011 Dec 6). Перспективно также применение кверцетина, как действующего на сигнальный каскад р38 MAPK (Chen S.F., Nieh S., Jao S.W., Liu C.L., Wu С.H., Chang C.Y. and Lin Y.S. Quercetin suppresses drug-resistant spheres via the p38 MAPK-Hsp27 apoptotic pathway in oral cancer cells (2012) PLoS One 7, e49275), но в то же время не являющегося препаратом выбора для лечения онкологических заболеваний.

Список найденных мутаций был проанализирован на наличие полиморфизмов, для которых известна их связь с чувствительностью к какому-либо препарату. Была выявлена мутация в гене FAS (1377G/A), для которой была показана повышенная чувствительность клеток опухоли к препарату (Ma F., Liao Y., Zi-Ping W., Xu В. Single nucleotide polymorphisms in FAS and FASL and sensitivity to gefitinib in patients with advanced non-smal cell lung cancer, J Clin Oncol 28, 2010 (suppl; abstr e13529)). Также была обнаружена герминативная однонуклеотидная замена в гене DPYD (C29R) которая ассоциирована с пониженной чувствительностью к 5-фторурацилу (Offer S.М., Wegner N.J., Fossum С., Wang K., Diasio R.B. Phenotypic profiling of DPYD variations relevant to 5-fluorouracil sensitivity using real-time cellular analysis and in vitro measurement of enzyme activity, Cancer Res. 2013 Mar 15; 73(6):1958-68. doi: 10.1158/0008-5472. CAN-12-3858. Epub 2013 Jan 17).

Итого были сформированы рекомендации по персонализированной противоопухолевой терапии на основе анализа данных о последовательностях и экспрессии генов для индивидуального пациента.

Химиотерапевтом было одобрено применение гефитиниба как препарата, ингибирующего EGFR-signalling каскад, а также вследствие наличия у пациента полиморфизма, обуславливающего повышенную чувствительность к данному лекарству. В результате лечения гефитинибом у пациента удалось добиться стойкой ремиссии заболевания. Таким образом, была подтверждена эффективность патентуемого метода по идентификации белков-мишеней, запускающих процесс канцерогенеза у индивидуального пациента, для последующей противоопухолевой фармакотерапии.

Способ поиска белков-мишеней, запускающих процесс канцерогенеза, в образцах тканей индивидуального пациента, для последующей противоопухолевой фармакотерапии, включающий следующие стадии:
а) определение методом секвенирования следующего поколения транскриптомных данных об уровнях экспрессии генов в образцах, полученных из ткани опухоли и здоровой ткани индивидуального пациента с последующей обработкой полученных данных с помощью алгоритма Subnetwork Enrichment Analysis и получением набора активированных генно-регуляторных сетей, состоящих из центрального гена регулятора и регулируемых им генов;
б) определение из транскриптомных данных дифференциально экспрессированных генов с помощью алгоритма DEseq;
в) определение методами секвенирования изменений в последовательностях ДНК, представленных в виде набора однонуклеотидных полиморфизмов и инделов в образцах, полученных из ткани опухоли и здоровой ткани индивидуального пациента;
г) определение среди найденных генетических вариантов генов-драйверов с помощью алгоритма Cancer-specific High-throughput Annotation of Somatic Mutations;
д) поиск канонических сигнальных путей, значимо обогащенных ранее найденными центральными генами регуляторами экспрессии, дифференциально экспрессированными генами, генами с идентифицированными однонуклеотидными полиморфизмами и инделами, генами-драйверами, для отбора сигнальных путей используют точный тест Фишера;
е) поиск методом перебора в составе идентифицированных сигнальных путей существующих белков-мишеней для лекарственных препаратов, предназначенных для противоопухолевой терапии, причем из найденных белков-мишеней выбирают белки с учетом имеющихся у пациента полиморфизмов, для которых установлена их связь с чувствительностью к определенному препарату.

Изобретение относится к области медицины и предназначено для ПЦР-диагностики гена резус-фактора плода по крови беременной женщины. Предложен набор с лиофилизированными праймерами, содержащий готовые к амплификации реакционные пробирки с лиофилизированными праймерами и праймерами-зондами для экзонов RHD-5 и RHD-7 гена RHD.

Генетические маркеры, ассоциированные с засухоустойчивостью кукурузы // 2575605

Изобретение относится к биохимии. Описан способ получения кукурузного растения с улучшенной оптимизаций водопотребления и растение, полученное таким способом.

Терапевтическая доставка и мониторинг с использованием представляющего интерес гена белка, слитого с репортером, и оптического отображения // 2575601

Настоящее изобретение относится к биотехнологии и представляет собой способ мониторинга экспрессии представляющего интерес гена полипептида CADM1, Rb, ZMYND10, RASSF5, PTEN, SERPINB5, EPB41L3 или DAPK1 для определения терапевтического эффекта соединения при лечении заболевания, связанного с экспрессией указанного представляющего интерес гена полипептида.

Набор синтетических олигонуклеотидных праймеров для выявления рнк вируса бешенства и способ выявления рнк вируса бешенства с помощью синтетических олигонуклеотидных праймеров в полимеразной цепной реакции с обратной транскрипцией (от-пцр) // 2575088

Изобретение относится к области биотехнологии, а именно к способу выявления РНК вируса бешенства и набору, который используется в данном способе. Способ включает проведение ОТ-ПЦР с олигонуклеотидными праймерами.

Фосфодиэстераза 4d7 в качестве маркера для агрессивного гормон-чувствительного рака предстательной железы // 2575076

Настоящее изобретение относится к фосфодиэстеразе 4D7 (PDE4D7) для применения в качестве маркера для агрессивного гормон-чувствительного рака предстательной железы, где экспрессия маркера повышена при сравнении экспрессии в ткани агрессивного гормон-чувствительного рака предстательной железы с экспрессией в нормальной ткани или ткани доброкачественной опухоли предстательной железы, и к применению PDE4D7 в качестве диагностического маркера для агрессивного гормон-чувствительного рака предстательной железы.

Способ молекулярно-генетического внутривидового типирования v. cholerae о1 и о139 серогрупп // 2575046

Изобретение относится к области биохимии. Заявлен способ молекулярно-генетического внутривидового типирования Vibrio cholerae O1 и O139 серогрупп.

Способ определения эффективной терапевтической дозы противоэпилептического препарата и риска развития побочных эффектов // 2574204

Изобретение относится к области биотехнологии, а именно к способу определения эффективной терапевтической дозы противоэпилептического препарата и риска развития побочных эффектов.

Набор синтетических олигонуклеотидов для выявления видовой принадлежности володушки многожильчатой (bupleurum multinerve dc.) // 2573937

Изобретение относится к области биотехнологии, в частности к набору синтетических олигонуклеотидов для выявления видовой принадлежности володушки многожильчатой (Bupleurum multinerve DC.), включающий проведение полимеразной цепной реакции с фрагментом ITS2 ядерной ДНК.

Биомаркер // 2573925

Изобретение относится к области биотехнологии, конкретно к маркерам рака, и может быть использовано в медицине. Выявление белка Engrailed-2 (EN2) или кодирующей его нуклеиновой кислоты в образце тканей мочевого пузыря или мочи от пациента может быть использовано в диагностике рака мочевого пузыря или для идентификации пациента, имеющего риск развития рака мочевого пузыря, а также для мониторинга прогрессирования рака мочевого пузыря у пациента или мониторинга эффективности лечения рака мочевого пузыря.

Варианты натрийуретического пептида с-типа // 2573911

Изобретение относится к области генной инженерии, конкретно к получению натрийуретического пептида C-типа (CNP), и может быть использовано в медицине. Получают пептид структуры PGQEHPNARKYKGANKKGLSKGCFGLKLDRIGSMSGLGC (Pro-Gly-CNP37), который используют для лечения дегенеративных костных патологий, отвечающих на CNP.

Детекция aad-1 объекта das-40278-9 // 2577143

Изобретение относится к области биохимии, в частности к способу определения зиготности растения кукурузы, содержащего трансгенную конструкцию, содержащую ген арилоксиалканоатдиоксигеназы, где указанный способ включает: получение образца геномной ДНК от указанного растения кукурузы; получение приведенного в контакт образца посредством контактирования указанного образца ДНК с первым праймером и вторым праймером и флуоресцентным зондом, определение зиготности указанного растения кукурузы, а также к набору для его осуществления. Изобретение позволяет эффективно определять зиготность растения кукурузы, содержащего ген арилоксиалканоатдиоксигеназы. 2 н. и 13 з.п. ф-лы, 3 ил., 1 табл., 1 пр.

Генетические полиморфизмы при возрастной дегенерации желтого пятна // 2577726

Предложенная группа изобретений относится к области медицины. Предложен способ прогнозирования у пациента с влажной возрастной дегенерацией желтого пятна (AMD) повышенной вероятности эффекта от лечения высокоаффинным антителом против VEGF, в частности, ранибизумабом. Предложен набор, содержащий первый олигонуклеотид и вторые олигонуклеотиды, специфичные для аллелей полиморфизма гена BATF, соответствующего rs175714. Если генотип содержит АА или AG, у пациента прогнозируют повышенную вероятность эффекта от указанного лечения. Предложенная группа изобретений обеспечивает эффективные средства и методы для прогнозирования повышенной вероятности эффекта от лечения у пациента с влажной AMD. 2 н. и 7 з.п. ф-лы, 1 ил., 5 табл., 1 пр.

Набор последовательности праймеров и аллель-специфических зондов для одновременной генодиагностики двух мутантных аллелей, вызывающих cvm и blad у крупного рогатого скота // 2577990

Изобретение относится к области биотехнологии, а именно к набору последовательностей праймеров и аллель-специфических зондов для одновременной генодиагностики двух мутантных аллелей, вызывающих комплекс аномалий позвоночника (CVM) и дефицит лейкоцитарной адгезии (BLAD) у крупного рогатого скота. Набор включает последовательности праймеров и аллель-специфических зондов, которые имеют следующую структуру: CVM_up gattctcaagagcttaattctaagga, CVM_low aagtaaaccccagcaaagccac, CVM_Wt (FAM)-aggtctcatggcagttct-(BHQ1), CVM_m (R6G)-catggcatttctcacagcat-(BHQ2), BLAD_up ttaggcagttgcgttc, BLAD_low acgttgacgaggtcatccacca, BLAD_Wt (ROX)-accccatcgacctgtacta-(BHQ1), BLAD_m (Cy5)-ccatcggcctgtactacct-(BHQ2). Предложенное изобретение позволяет одновременно диагностировать CVM и BLAD у крупного рогатого скота методом ПЦР в реальном времени, а также сократить время выполнения полимеразной цепной реакции в реальном времени. 3 ил., 2 табл., 1 пр.

Способ идентификации нативных пар фрагментов днк или рнк, присутствующих в одних и тех же живых клетках // 2578009

Изобретение относится к биотехнологии, а именно к способу селективного подавления амплификации в ходе ПЦР фрагментов ДНК. Добавляют в реакционную смесь блокирующий олигонуклеотид в концентрации, которая превышает концентрацию праймеров, используемых для ПЦР, не менее чем в 2 раза. 3′-концевая последовательность блокирующего олигонуклеотида служит для его отжига на 3′-участок фрагмента ДНК, амплификация которого должна быть подавлена, и имеет длину, обеспечивающую ее эффективную гибридизацию на 3′-участок фрагмента ДНК при температуре отжига праймера, используемого в ПЦР. 5′-концевая последовательность блокирующего олигонуклеотида служит матрицей для достройки нового 3′-конца для указанного фрагмента ДНК, где новая 3′-концевая последовательность не имеет комплементарности с предполагаемыми матрицами и исключает дальнейшее участие этого фрагмента в амплификации в качестве затравки. Предложенное изобретение позволяет провести селективное подавление амплификации с высокой эффективностью. 4 з.п. ф-лы, 6 табл., 2 пр., 8 ил.

Способ прогнозирования достоверности ответа на стандартную двухкомпонентную противовирусную терапию пегилированными интерферонами и рибавирином у пациентов с хроническим гепатитом с, генотипом 1в // 2578030

Изобретение относится к области медицины и предназначено для прогнозирования ответа на стандартную двухкомпонентную противовирусную терапию у пациентов с хроническим гепатитом С (ХГС), генотипом 1в. Для прогнозирования достоверности ответа на стандартную двухкомпонентную противовирусную терапию пегилированными интерферонами и рибавирином у пациентов с хроническим гепатитом С, генотипом 1в, осуществляют генетическое исследование крови на полиморфизм гена IL28B и определяют групповую принадлежность крови. Прогнозируют устойчивый вирусологический ответ в 100% случаев у пациентов с группой крови 0αβ (I) и полиморфизмом гена IL28B в rs12979860 с генотипом С/С и генотипом Т/Т в rs8099917. Прогнозируют устойчивый вирусологический ответ в 80% случаев у пациентов с группой крови Аβ (II) и при однонуклеотидной замене цитозина на тимин (С>Т) в локусе rs12979860 гена IL28B. При однонуклеотидной замене тимина на гуанин (T>G) в rs8099917 гена IL28B устойчивый вирусологический ответ прогнозируют только у пациентов с группой крови Вα (III). Использование изобретения позволяет повысить достоверность и эффективность прогнозирования стандартной противовирусной терапии. 2 табл.

Аптамер к химазе и его применение // 2579667

Группа изобретений относится к обоасти биохимии и биотехнологии. Представлены аптамер, связывающийся с химазой и ингибирующий активность химазы, содержащий нуклеотидную последовательность, представленную как X1GAUAGAN1N2UAAX2, где X1 и X2 идентичны или не идентичны друг другу и каждый означает A или G, а N1 и N2 идентичны или не идентичны друг другу и каждый означает A, G, C, U или T; комплекс, включающий аптамер и функциональное вещество, например вещество, обладающее сродством, вещество для мечения, фермент, средство доставки лекарственного средства, лекарственное средство; лекарственное средство или реагент, содержащее аптамер или комплекс; способы детекции и очистки химазы с использованием аптамера или комплекса. 9 н. и 7 з.п. ф-лы, 8 ил., 9 табл., 9 пр.

Трансгенное животное, отличное от человека, и его применения // 2579701

Группа изобретений относится к области генной инженерии, в целом к трансгенным конструкциям, трансгенным животным, отличным от человека, способам количественного анализа активации GPCR лигандов неинвазивно в интактных животных, тканевых срезах или в нативных клетках, используя трансгенную модель, содержащую систему биолюминесцентного трансгена-репортера, которая является чувствительной к модуляции путей после связывания лиганда с рецепторами GPCR. Трансгенное животное, отличное от человека, для оценки функции рецептора, сопряженного с G-белком (GPCR), имеющее геном, содержащий индуцируемый циклическим АМФ (цАМФ), трансген, содержащий, в направлении от 5′-конца к 3′-концу, первый инсуляторный элемент, ответный элемент цАМФ, промотор, биолюминесцентный репортер, миниген человеческого гормона роста (hGH) и второй инсуляторный элемент. Использование трансгенной конструкции приводит к повышению мышиных линий, продуцирующих мРНК и белок, а также к увеличению уровня экспрессии репортерного гена. 9 н. и 11 з.п. ф-лы, 41 ил., 10 табл.

Тест-система для обнаружения экспрессии генов nat2 у человека // 2580005

Изобретение относится к области биотехнологии, а именно к тест-системе для обнаружения экспрессии гена NAT2 у человека. Данная тест-система включает смесь праймеров, комплементарных концам разных цепей требуемого фрагмента ДНК-матрицы для ПЦР, эндонуклеазу рестрикции с буфером и технологическую смесь для ПЦР с Taq-полимеразой. В качестве смеси праймеров она содержит пару дезоксиолигонуклеотидов, обладающих активностью прямого и обратного праймеров в реакции обратной транскрипции и полимеразной цепной реакции со следующей структурой: Nat2(F) MR1ACCWAAYCAGCCAGR1AAGC и Nat2(R) AGMCCSACCAWACAGYAMACC, где F и R - прямой и обратный праймеры соответственно и A, G, С, R1, W, М, S и Y - кодовые обозначения нуклеотидов. Предложенное изобретение позволяет с высокой достоверностью обнаруживать экспрессию гена NAT2 у человека. 6 ил., 3 табл., 2 пр.

Способ прогнозирования злокачественной трансформации эрозивно-язвенной формы красного плоского лишая слизистой оболочки полости рта // 2580222

Изобретение относится к биотехнологии, конкретно к стоматологии и медицинской генетике, и может быть использовано для прогнозирования злокачественной трансформации эрозивно-язвенной формы красного плоского лишая (КПЛ) слизистой оболочки полости рта (СОПР). Из периферической венозной крови выделяют ДНК, проводят молекулярно-генетический анализ Arg72Pro полиморфизма 4 экзона гена TP53. При выявлении генотипа Pro/Pro и аллеля Pro прогнозируют риск злокачественной трансформации эрозивно-язвенной формы КПЛ. Изобретение обеспечивает получение прогностических критериев злокачественной трансформации КПЛ на основе молекулярно-генетических маркеров. 2 ил., 3 табл., 2 пр.

Способ оценки цитотоксичности рибосом-инактивирующих белков ii типа in vitro // 2580225

Изобретение относится к области токсикологии и может быть использовано для определения в образцах жидкости или растений токсичных веществ, а именно рибосом-инактивирующих белков II типа. Для повышения селективности способа и сокращения времени его осуществления культивирование клеток в опытной культуре осуществляют 15 и более мин, забирают лизаты клеток из опытной и контрольной культур клеток, выделяют РНК, определяют общего содержания рибосомальной 28S РНК и содержание модифицированных фрагментов 28S рибосомальной РНК методом ПЦР-РВ, при этом общее содержание 28S рибосомальной РНК определяют с использованием олигонуклеотидов, соответствующих прямому праймеру к дистальному фрагменту 28S рРНК SEQ1 и обратному праймеру к дистальному фрагменту 28S рРНК SEQ2 соответственно; содержание модифицированных 28S рибосомальных РНК определяют с использованием олигонуклеотидов, соответствующих прямому праймеру к модифицированному фрагменту 28S рРНК SEQ3, и обратному праймеру к модифицированному фрагменту 28S рРНК SEQ4; при превышении содержания модифицированных 28S рибосомальных РНК в опытной культуре в сравнении с контрольной делают заключение о цитотоксичности рибосом-инактивирующих белков II типа; определяют общее количество 28S рибосомальных РНК и количество модифицированных 28S рибосомальных РНК в опытной культуре клеток, и по доле модифицированных 28S рибосомальных РНК в процентах оценивают уровень цитотоксичности. 6 з.п. ф-лы, 3 ил., 1 табл.