Обнаружение мутаций и плоидности в хромосомных сегментах - заявка 2016141308 на патент на изобретение в РФ

1. Способ определения плоидности хромосомного сегмента в образце индивидуума, предусматривающий:
a. получение данных о частоте аллелей, сгенерированных из образца, содержащих количество каждого аллеля, присутствующего в образце, в каждом локусе в совокупности полиморфных локусов на хромосомном сегменте;
b. создание фазированной аллельной информации для совокупности полиморфных локусов путем оценки фазы данных о частоте аллелей;
c. создание индивидуальных вероятностей частот аллелей для полиморфных локусов для различных состояний плоидности с использованием данных о частоте аллелей, где индивидуальные вероятности получают с использованием совокупности моделей, как различных состояний плоидности, так и фракций аллельного дисбаланса для совокупности полиморфных локусов;
d. создание совместных вероятностей для совокупности полиморфных локусов с использованием индивидуальных вероятностей и фазированной аллельной информации и учет взаимосвязи между полиморфными локусами на хромосомном сегменте; а также
e. выбор, основанный на совместных вероятностях, наиболее подходящей модели, указывающей на хромосомную плоидность, тем самым определяя плоидность хромосомного сегмента, где образец представляет собой образец крови, образец плазмы или образец сыворотки от индивидуума, у которого подозревают наличие злокачественной опухоли, и способ дополнительно предусматривает определение на основании выбора того, присутствует ли в клетках опухоли индивидуума вариация числа копий.
2. Способ по п. 1, при котором данные о частоте аллелей получают из данных о последовательности нуклеиновых кислот.
3. Способ по п. 1, дополнительно предусматривающий стадию исправления ошибок в данных о частоте аллелей и использование исправленных данных о частоте аллелей для создания стадии индивидуальных вероятностей, где исправляемые ошибки представляют собой систематические ошибки эффективности амплификации аллелей.
4. Способ обнаружения хромосомной плоидности в образце индивидуума, предусматривающий:
a. получение данных о последовательности нуклеиновой кислоты, сгенерированных из образца, для аллелей в совокупности полиморфных локусов на хромосомном сегменте у индивидуума;
b. обнаружение частот аллелей в совокупности локусов с использованием данных о последовательностях нуклеиновых кислот;
c. коррекция систематических ошибок эффективности амплификации аллелей в обнаруженных частотах аллелей для получения скорректированных частот аллелей для совокупности полиморфных локусов;
d. создание фазированной аллельной информации для совокупности полиморфных локусов путем оценки фазы данных о последовательностях нуклеиновых кислот;
e. создание индивидуальных вероятностей частот аллелей для полиморфных локусов для различных состояний плоидности путем сравнения скорректированных частот аллелей с совокупностью моделей различных состояний плоидности и фракций аллельного дисбаланса совокупности полиморфных локусов;
f. создание совместных вероятностей для совокупности полиморфных локусов путем объединения индивидуальных вероятностей с учетом связи между полиморфными локусами на хромосомном сегменте; а также
g. выбор, основанный на совместных вероятностях, наиболее подходящей модели, указывающей на хромосомную плоидность, где образец представляет собой образец крови, образец плазмы или образец сыворотки от индивидуума, у которого подозревают наличие злокачественной опухоли, и способ дополнительно предусматривает определение на основании выбора того, присутствует ли в клетках опухоли индивидуума вариация числа копий.
5. Способ по любому из пп. 1-4, при котором индивидуальные вероятности создаются путем моделирования состояний плоидности первого гомолога хромосомного сегмента и второго гомолога хромосомного сегмента, причем состояния плоидности заключаются в том, что:
(1) все клетки характеризуются отсутствием делеции или амплификации первого гомолога или второго гомолога хромосомного сегмента;
(2) по меньшей мере некоторые клетки характеризуются наличием делеции первого гомолога или амплификации второго гомолога хромосомного сегмента; а также
(3) по меньшей мере некоторые клетки характеризуются наличием делеции второго гомолога или амплификации первого гомолога хромосомного сегмента.
6. Способ по п. 4, при котором ошибки, которые исправляются, содержат загрязнение от окружающей среды и загрязнение генотипа и определяются для гомозиготных аллелей в образце.
7. Способ по п. 4, при котором отбор осуществляется путем анализа величины разницы между фазированной аллельной информацией и расчетными частотами аллелей, полученными для моделей, и выбирается модель с меньшей величиной разницы.
8. Способ по любому из пп. 1-3, 4, 6 и 7, при котором индивидуальные вероятности частот аллелей
(i) получают на основании бета-биномиальной модели ожидаемых и наблюдаемых частот аллелей в совокупности полиморфных локусов; или
(ii) получают с использованием Байесовского классификатора.
9. Способ по любому из пп. 2 или 4, при котором данные о последовательности нуклеиновой кислоты получают посредством выполнения секвенирования ДНК с высокой пропускной способностью множества копий серий ампликонов, полученных с использованием мультиплексной реакции амплификации, причем каждый ампликон из серии ампликонов охватывает по меньшей мере один полиморфный локус совокупности полиморфных локусов и причем каждый из полиморфных локусов совокупности амплифицируется.
10. Способ по п. 9, при котором мультиплексную реакцию амплификации
(i) осуществляют в условиях ограниченного количества праймера; или
(ii) содержит от 1000 до 100000 мультиплексных реакций.
11. Способ по п. 9, при котором хромосомную плоидность определяют для совокупности хромосомных сегментов в образце.
12. Способ по любому из пп. 1-3, 4, 6 и 7, в котором средний аллельный дисбаланс, превышающий 0,45%, свидетельствует о присутствии в клетках опухоли индивидуума вариации числа копий.
13. Способ по любому из пп. 1-3, 4, 6 или 7, при котором образец представляет собой образец плазмы от индивидуума, у которого ранее имелась солидная опухоль.
14. Способ по пп. 1-3, 4, 6 или 7, дополнительно предусматривающий определение, представлен ли однонуклеотидный вариант в образце в целевой совокупности однонуклеотидных вариантов, причем обнаружение либо вариации числа копий, либо однонуклеотидного варианта, либо и того и другого указывает на наличие циркулирующих опухолевых нуклеиновых кислот в образце.
15. Способ по п. 13, дополнительно предусматривающий получение информации о гаплотипе хромосомного сегмента для опухоли индивидуума и использование информации о гаплотипе для создания совокупности моделей различных состояний плоидности и фракций аллельного дисбаланса совокупности полиморфных локусов.
16. Способ по любому из пп. 1-3, 4, 6 или 7, при котором способ дополнительно предусматривает
(i) стадию удаления выбросов из скорректированных данных о частоте аллеля перед сравнением скорректированных частот аллелей с совокупностью моделей; или
(ii) реализацию способа на контрольном образце с известным средним соотношением аллельного дисбаланса.
17. Система для определения хромосомной плоидности в образце индивидуума, содержащая:
a. входной процессор, выполненный с возможностью приема данных о частоте аллелей, сгенерированных из образца, содержащих количество каждого аллеля, присутствующих в образце в каждом локусе в совокупности полиморфных локусов на хромосомном сегменте;
b. моделирующее устройство, выполненное с возможностью:
I. создавать фазированную аллельную информацию для совокупности полиморфных локусов путем оценки фазы данных о частоте аллелей; а также
II. создавать индивидуальные вероятности частот аллелей для полиморфных локусов для различных состояний плоидности с использованием данных о частоте аллелей, где индивидуальные вероятности получают с использованием совокупности моделей, как различных состояний плоидности, так и фракций аллельного дисбаланса для совокупности полиморфных локусов; а также
III. создавать совместные вероятности для совокупности полиморфных локусов с использованием индивидуальных вероятностей и фазированной аллельной информации и учитывать взаимосвязь между полиморфными локусами на хромосомном сегменте; а также
c. менеджер гипотез, выполненный с возможностью выбирать, на основании совместных вероятностей, наиболее подходящую модель, указывающую на хромосомную плоидность, тем самым определяя плоидность хромосомного сегмента, где образец представляет собой образец крови, образец плазмы или образец сыворотки от индивидуума, у которого подозревают наличие злокачественной опухоли, и способ дополнительно предусматривает определение на основании выбора того, присутствует ли в клетках опухоли индивидуума вариация числа копий.
18. Система по п. 17, в которой данные о частоте аллелей создаются системой секвенирования нуклеиновых кислот.
19. Система по п. 18, дополнительно предусматривающая блок коррекции ошибок, выполненный с возможностью исправления ошибок в данных о частоте аллелей, причем исправленные данные о частоте аллелей используются для создания стадии индивидуальных вероятностей и причем ошибки, которые исправляют, представляют собой эффективность амплификации аллеля.
20. Система для определения хромосомной плоидности в образце индивидуума, содержащая:
a. входной процессор, выполненный с возможностью приема данных о последовательности нуклеиновой кислоты, сгенерированных из образца, для аллелей в совокупности полиморфных локусов на хромосомном сегменте у индивидуума, и обнаружения частоты аллелей в совокупности локусов с использованием данных о последовательности нуклеиновой кислоты;
b. блок коррекции ошибок, выполненный с возможностью исправления ошибок в обнаруженных частотах аллелей и создания скорректированных частот аллелей для совокупности полиморфных локусов;
c. моделирующее устройство, выполненное с возможностью:
I. создавать фазированную аллельную информацию для совокупности полиморфных локусов путем оценки фазы данных о последовательности нуклеиновой кислоты;
II. создавать индивидуальные вероятности частот аллелей для полиморфных локусов для различных состояний плоидности путем сравнения фазированной аллельной информации с совокупностью моделей различных состояний плоидности и фракций аллельного дисбаланса совокупности полиморфных локусов; а также
III. создавать совместные вероятности для совокупности полиморфных локусов путем объединения индивидуальных вероятностей с учетом относительного расстояния между полиморфными локусами на хромосомном сегменте; а также
d. менеджер гипотез, выполненный с возможностью выбора, основанного на совместных вероятностях, наиболее подходящей модели, указывающей на хромосомную анеуплоидию, где образец представляет собой образец крови, образец плазмы или образец сыворотки от индивидуума, у которого подозревают наличие злокачественной опухоли, и способ дополнительно предусматривает определение на основании выбора того, присутствует ли в клетках опухоли индивидуума вариация числа копий.
21. Система по п. 20, в которой менеджер гипотез выбирает путем анализа величины разницы между фазированной аллельной информацией и расчетными частотами аллелей, созданными для моделей и выбирает модель с меньшей величиной разницы.
22. Система по п. 21, в которой моделирующее устройство создает индивидуальные вероятности частот аллелей на основе бета-биномиальной модели ожидаемых и наблюдаемых частот аллелей в совокупности полиморфных локусов.
23. Энергонезависимый машиночитаемый носитель для обнаружения хромосомной плоидности в образце индивидуума, содержащий машиночитаемый код, который, когда он выполняется устройством обработки данных, приводит к тому, что устройство обработки данных:
a. получает данные о частоте аллелей, сгенерированные из образца, содержащие количество каждого аллеля, присутствующего в образце в каждом локусе в совокупности полиморфных локусов на хромосомном сегменте;
b. создает фазированную аллельную информацию для совокупности полиморфных локусов путем оценки фазы данных о частоте аллелей;
c. создает индивидуальные вероятности частот аллелей для полиморфных локусов для различных состояний плоидности с использованием данных о частоте аллелей, где индивидуальные вероятности получают с использованием совокупности моделей, как различных состояний плоидности, так и фракций аллельного дисбаланса для полиморфных локусов;
d. создает совместные вероятности для совокупности полиморфных локусов с использованием индивидуальных вероятностей и фазированной аллельной информации и учитывает взаимосвязь между полиморфными локусами на хромосомном сегменте; а также
e. выбирает, основываясь на совместных вероятностях, наиболее подходящую модель, указывающую на хромосомную плоидность, определяя тем самым плоидность хромосомного сегмента, где образец представляет собой образец крови, образец плазмы или образец сыворотки от индивидуума, у которого подозревают наличие злокачественной опухоли, и способ дополнительно предусматривает определение на основании выбора того, присутствует ли в клетках опухоли индивидуума вариация числа копий.
24. Машиночитаемый носитель в соответствии с п. 23, в котором данные о частоте аллелей получают из данных о последовательностях нуклеиновых кислот.
25. Машиночитаемый носитель в соответствии с п. 23, дополнительно предусматривающий исправление ошибок в данных о частоте аллелей и использование исправленных данных о частоте аллелей для создания стадии индивидуальных вероятностей, где ошибки, которые исправляются, представляют собой систематические ошибки эффективности амплификации аллелей.
26. Энергонезависимый машиночитаемый носитель для обнаружения хромосомной плоидности в образце индивидуума, содержащий машиночитаемый код, который, когда он выполняется устройством обработки данных, приводит к тому, что устройство обработки данных:
a. получает данные о последовательности нуклеиновой кислоты, сгенерированные из образца, для аллелей в совокупности полиморфных локусов на хромосомном сегменте у индивидуума;
b. обнаруживает частоты аллелей в совокупности локусов с использованием данных о последовательностях нуклеиновых кислот;
c. корректирует систематические ошибки эффективности амплификации аллелей в обнаруженных частотах аллелей для получения скорректированных частот аллелей для совокупности полиморфных локусов;
d. создает фазированную аллельную информацию для совокупности полиморфных локусов путем оценки фазы данных о последовательностях нуклеиновых кислот;
e. создает индивидуальные вероятности частот аллелей для полиморфных локусов для различных состояний плоидности путем сравнения скорректированных частот аллелей с совокупностью моделей различных состояний плоидности и фракций аллельного дисбаланса совокупности полиморфных локусов;
f. создает совместные вероятности для совокупности полиморфных локусов путем объединения индивидуальных вероятностей с учетом связи между полиморфными локусами на хромосомном сегменте; а также
g. выбирает основанную на совместных вероятностях наиболее подходящую модель, указывающую на хромосомную анеуплоидию, где образец представляет собой образец крови, образец плазмы или образец сыворотки от индивидуума, у которого подозревают наличие злокачественной опухоли, и способ дополнительно предусматривает определение на основании выбора того, присутствует ли в клетках опухоли индивидуума вариация числа копий.
27. Машиночитаемый носитель по п. 26, в котором выбор осуществляется путем анализа величины разницы между фазированной аллельной информацией и расчетными частотами аллелей, создаваемые для моделей, и выбирается модель с меньшей величиной разницы.
28. Машиночитаемый носитель по любому из пп. 23-25 и 26, в котором индивидуальные вероятности частот аллелей создаются на основании бета-биномиальной модели ожидаемой и наблюдаемой частот аллелей в совокупности полиморфных локусов.
29. Способ по любому из пп. 2-3, 4, 6 или 7, дополнительно предусматривающий определение, представлен ли однонуклеотидный вариант в образце в целевой совокупности однонуклеотидных вариантов, причем обнаружение либо вариации числа копий, либо однонуклеотидного варианта, либо и того и другого указывает на наличие циркулирующих опухолевых нуклеиновых кислот в образце, данные о последовательности нуклеиновой кислоты получают посредством выполнения секвенирования ДНК с высокой пропускной способностью множества копий серий ампликонов, полученных с использованием мультиплексной реакции амплификации, причем каждый ампликон из серии ампликонов охватывает по меньшей мере один полиморфный локус совокупности полиморфных локусов и причем каждый из полиморфных локусов совокупности амплифицируется, и где образец крови, образец плазмы или образец сыворотки используется для определения, присутствует ли в клетках опухоли индивидуума вариация числа копий, или однонуклеотидная вариация, или и то и другое.
Наверх