Устройство определения поражения заболеванием, способ определения поражения заболеванием и программа определения поражения заболеванием

Настоящее изобретение относится к технологии для осуществления определения поражения заболеванием с использованием нейронной сети для того, чтобы осуществлять обучение с использованием данных об уровнях экспрессии мкРНК, и извлечения мкРНК, которая служит в качестве отличительного биомаркера для заболевания посредством нейронной сети. В результате заявленной группы решений получают данные образца, в которых соответствующие уровни экспрессии множества типов биомаркеров регистрируют для каждого индивидуума, генерируют обученную модель, в которой поражение заболеваниями получают с возможностью определения предварительно посредством выполнения машинного обучения с использованием обучающих данных, множество данных образцов, к которым прикрепляют маркировочную информацию о поражении заболеванием, вводят в обученную модель и осуществляют вычисление, количественно определяют степени важности соответствующего признака из множества биомаркеров, получаемого с использованием обученной модели, посредством вычисления определения поражения, для каждых данных образца, и извлекают предварительно определяемое число биомаркеров в качестве отличительных биомаркеров, относящихся к заболеванию на основе количественно определенных степеней важности всех данных образца для каждого биомаркера. Технический результат заключается в повышении точности диагноза посредством эффективного использования всех данных об уровнях экспрессии и возможности использования при установке диагноза большего количества типов мкРНК. 3 н. и 10 з.п. ф-лы, 6 ил.

 

Область техники

[0001] Настоящее изобретение относится к технологии для осуществления определения поражения заболеванием с использованием нейронной сети для того, чтобы осуществлять обучение с использованием данных об уровнях экспрессии мкРНК, и извлечения мкРНК, которая служит в качестве отличительного биомаркера для заболевания посредством нейронной сети.

Уровень техники

[0002] Предложены стандартные приемы для диагностирования заболеваний, сосредоточенные на уровнях экспрессии микроРНК (мкРНК) в образце, полученном из организма. мкРНК представляет собой функциональную нуклеиновую кислоту, состоящую из одноцепочечной молекулы РНК длиной 21-25 оснований, и имеет функцию подавления трансляции различных генов, имеющих целевой участок, комплементарный ей, а также известно, что она управляет базовыми биологическими функциями, такими как образование, дифференцировка и пролиферация клетки, гибель клеток и т.п. В настоящее время обнаружено 2500 или больше типов мкРНК человека. Идут исследования по диагностированию и раннему обнаружению конкретных заболеваний, которые сосредоточены на том факте, что уровень экспрессии мкРНК, во всем многообразии мкРНК, варьирует между индивидуумом, пораженным конкретным заболеванием, и непораженным индивидуумом.

[0003] Патентная литература 1 представляет собой пример диагностического инструмента для диагностирования конкретного заболевания с использованием мкРНК. В патентной литературе 1 предложен способ использования конкретной мкРНК в качестве биомаркера подглоточной злокачественной опухоли, способ определения подглоточной злокачественной опухоли, набор для определения подглоточной злокачественной опухоли и т.п.

Список цитируемой литературы

Патентная литература

[0004] Патентная литература 1: JP 2011-72229 A

Краткое изложение

Техническая проблема

[0005] В патентной литературе 1 сравнивают мкРНК из ткани подглоточной злокачественной опухоли и мкРНК из нормальной подглоточной ткани, находят аномальную экспрессию конкретной мкРНК в ткани подглоточной злокачественной опухоли и используют конкретную мкРНК в качестве биомаркера для диагностирования подглоточной злокачественной опухоли. При стандартном диагностировании с использованием мкРНК находят и используют мкРНК, связанную с определенным заболеванием, и даже при данном диагностировании, диагностирование осуществляют на основе уровня экспрессии мкРНК, связанной с заболеванием.

[0006] Несмотря на то, что способ осуществления диагностирования, сосредоточенный только на мкРНК, связанной с заболеванием, позволяет выполнять диагностирование с определенной степенью точности, проблема состоит в том, что положительный случай заболевания может иметь место, даже когда значимое различие, которое можно диагностировать как положительное, не проявляется в значении мкРНК, представляющей интерес. Такая проблема может существовать, поскольку необходимо задавать пороговое значение около значения мкРНК, представляющей интерес, и проводить диагностирование, но можно сказать, что эта проблема возникает, когда диагностирование осуществляют, сосредоточившись только на некотором числе мкРНК. Однако существует такая проблема, что нелегко использовать все данные огромной мкРНК для диагностирования с использованием того же приема.

[0007] В патентной литературе 1 сравнивают мкРНК из ткани подглоточной злокачественной опухоли и мкРНК из нормальной подглоточной ткани и извлекают конкретную мкРНК, и такой способ нахождения отличительной мкРНК с помощью способа сравнения фактически пораженных тканей является эффективным. Однако усовершенствование точности диагноза посредством эффективного использования всех данных об уровнях экспрессии 2500 или больше типов мкРНК невозможно с помощью способа определения, с помощью человека, будь различие значимым, когда сравнивают уровни экспрессии индивидуальных мкРНК.

[0008] Настоящее изобретение выполнено ввиду вышеуказанной проблемы, и цель настоящего изобретения состоит в том, чтобы предоставлять прием определения поражения заболеванием, который делает возможным определение поражения заболеванием посредством нейронной сети, чтобы осуществлять обучение с использованием данных об уровнях экспрессии биомаркеров, таких как мкРНК, и предоставлять прием извлечения признака заболевания, который делает возможным извлечение отличительного биомаркера для заболевания посредством нейронной сети.

Решение проблемы

[0009] Устройство определения поражения заболеванием в соответствии с настоящим изобретением включает в себя блок получения данных образца, выполненный с возможностью получения данных образца, включающих в себя соответствующие уровни экспрессии биомаркеров, в том числе множества типов мкРНК, в полученном у человека образце, обученную модель, причем поражение заболеваниями получают с возможностью определения предварительно посредством выполнения машинного обучения с использованием обучающих данных, и блок определения поражения, выполненный с возможностью осуществлять определения поражения для данных образца на основе степени важности каждого биомаркера, используя обученную модель.

[0010] Устройство определения поражения заболеванием в соответствии с настоящим изобретением включает в себя блок получения данных образца, выполненный с возможностью получения данных образца, включая соответствующие уровни экспрессии биомаркеров, включая множество типов мкРНК, в полученном у человека образце, обученную модель, причем поражение заболеваниями получают с возможностью определения предварительно посредством выполнения машинного обучения с использованием обучающих данных, блок вычисления важности, выполненный с возможностью вводить данные образца в обученную модель, чтобы количественно определять степень важности каждого биомаркера, и блок определения поражения, выполненный с возможностью осуществлять определение поражения для данных образца по степени важности.

[0011] Кроме того, устройство определения поражения заболеванием в соответствии с настоящим изобретением включает в себя блок извлечения признака, выполненный с возможностью извлекать отличительный биомаркер, относящийся к заболеванию, на основе степени важности, причем определение поражения осуществляют на основе важности признака, которая представляет собой степень важности каждого отличительного биомаркера, в случае выполнения определения заболевания с использованием только извлеченного отличительного биомаркера.

[0012] Кроме того, устройство определения поражения заболеванием в соответствии с настоящим изобретением включает в себя блок извлечения признака, выполненный с возможностью извлекать отличительный биомаркер, относящийся к заболеванию, на основе степени важности, и блок вычисления важности признака, выполненный с возможностью количественно определять важность признака, которая представляет собой степень важности каждого отличительного биомаркера, в случае выполнения определения заболевания только с использованием извлеченного отличительного биомаркера, причем блок определения поражения выполняет определение поражения по важности признака.

[0013] Кроме того, в устройстве определения поражения заболеванием в соответствии с настоящим изобретением, блок вычисления важности количественно определяет степени важности признака соответствующих биомаркеров с помощью процесса вычисления функции потерь Li в отношении i-х данных образца, используя обученную модель, для каждых данных образца, процесса выполнения обратного распространения ошибки с использованием значения Li функции потерь в качестве начальной точки и вычисления градиента gij=∂Li/∂xj в отношении признака xj, соответствующего каждому из множества типов биомаркеров образца i, и процесса получения абсолютного значения суммы градиентов для всех образцов в качестве степени важности Sj=|Σ_{i}gij| признака.

[0014] Кроме того, в устройстве определения поражения заболеванием в соответствии с настоящим изобретением обучающие данные представляют собой данные образца, к которым прикрепляют маркировочную информацию в отношении того, поражены ли индивидуумы заболеваниями.

[0015] Кроме того, в устройстве определения поражения заболеванием в соответствии с настоящим изобретением, создание обученной модели осуществляют после осуществления процесса выбеливания, процесс выбеливания представляет собой линейное преобразование каждой размерности так, что усредненное по всем обучающим данным становится 0 и дисперсия становится 1, для каждой размерности вектора признаков из обучающих данных.

[0016] Способ определения поражения заболеванием в соответствии с настоящим изобретением включает стадии получения данных образца, включая соответствующие уровни экспрессии биомаркеров, включающих множество типов мкРНК, в полученном у человека образце, создания обученной модели, причем поражение заболеваниями получают с возможностью определения предварительно посредством выполнения машинного обучения с использованием обучающих данных, и выполнения определения поражения для данных образца на основе степени важности каждого биомаркера, используя обученную модель.

[0017] Устройство извлечения признака заболевания в соответствии с настоящим изобретением включает в себя блок получения данных образца, выполненный с возможностью получения данных образца, причем соответствующие уровни экспрессии биомаркеров, включая множество типов мкРНК, в полученном у человека образце регистрируют для каждого индивидуума, блок определения поражения, содержащий обученную модель, причем поражение заболеваниями получают с возможностью определения предварительно посредством выполнения машинного обучения с использованием обучающих данных, и блок извлечения признака, выполненный с возможностью вводить множество данных образцов, к которым прикрепляют маркировочную информацию о поражении заболеванием, в блок определения поражения для того, чтобы определять поражение, чтобы количественно определять степени важности соответствующего признака из множества биомаркеров, которые получают с использованием обученной модели посредством вычисления определения поражения, для каждых данных образца, и для того, чтобы извлекать предварительно определяемое число биомаркеров в качестве отличительных биомаркеров, относящихся к заболеванию, на основе числовых значений степени важности множества данных образцов, для каждого биомаркера.

[0018] Способ извлечения признака заболевания в соответствии с настоящим изобретением включает стадии получения данных образца, причем соответствующие уровни экспрессии биомаркеров, включая множество типов мкРНК, в полученном у человека образце регистрируют для каждого индивидуума, создания обученной модели, причем поражение заболеваниями получают с возможностью определения предварительно посредством выполнения машинного обучения с использованием обучающих данных, и ввода множества данных образцов, к которым прикрепляют маркировочную информацию о поражении заболеванием, в обученную модель для того, чтобы определять поражение, количественного определения степеней важности соответствующего признака множества биомаркеров, которые получают с использованием обученной модели посредством вычисления определения поражения, для каждых данных образца, и извлечения предварительно определяемого числа биомаркеров в качестве отличительных биомаркеров, относящихся к заболеванию, на основе числовых значений степени важности множества данных образцов, для каждого биомаркера.

Полезные эффекты изобретения

[0019] В соответствии с настоящим изобретением, обученную модель генерируют посредством выполнения машинного обучения, при этом обновляя параметры в процессе обучения с использованием нейронной сети. Следовательно, даже если человек не распознает существование мкРНК, связанной с заболеванием, предварительно, определение поражения можно осуществлять с высокой точностью.

[0020] Кроме того, в соответствии с настоящим изобретением, определение злокачественной опухоли и доброкачественной опухоли, что сложно с использованием стандартных способов тестирования, можно осуществлять с высокой точностью.

[0021] Кроме того, в соответствии с настоящим изобретением, множество данных образцов, к которым прикрепляют маркировочную информацию о пораженных индивидуумах, вводят в созданную обученную модель и вычисляют определение поражения, в процессе вычисления получают степень важности данных образца, получают абсолютное значение суммы степеней важности всех данных образца, ранжируют признак данных образца на основе абсолютного значения суммы степеней важности, и извлекают биомаркеры, соответствующие предварительно определяемому числу признака сверху в качестве отличительных биомаркеров, относящихся к заболеванию. Следовательно, важную мкРНК при определении поражения заболеванием можно извлекать в качестве отличительной мкРНК. Можно снижать производительность обработки, требуемую от компьютера, и можно усовершенствовать скорость обработки, при этом усовершенствуя точность определения поражения с использованием извлеченных отличительных биомаркеров.

Краткое описание фигур

[0022] На фиг. 1 представлена блочная диаграмма, иллюстрирующая конфигурацию устройства 10 определения поражения заболеванием в соответствии с настоящим изобретением.

На фиг. 2 представлена пояснительная диаграмма, иллюстрирующая идею обучения в нейронной сети.

На фиг. 3 представлена блок-схема, иллюстрирующая поток процесса обучения в устройстве 10 определения поражения заболеванием.

На фиг. 4 представлена блок-схема, иллюстрирующая поток процесса извлечения признака в устройстве 10 определения поражения заболеванием.

На фиг. 5 представлена таблица, иллюстрирующая точность определения поражения, когда настоящее изобретение применяют для различных заболеваний.

На фиг. 6 представлена блочная диаграмма, иллюстрирующая конфигурацию устройства 22 определения поражения заболеванием, в котором используют прием стэкинга.

Описание вариантов осуществления

[0023] [Первый вариант осуществления]

Далее, пример устройства определения поражения заболеванием в соответствии с первым вариантом осуществления будет описан со ссылкой на фиг. На фиг. 1 представлена блочная диаграмма, иллюстрирующая конфигурацию устройства 10 определения поражения заболеванием в соответствии с настоящим изобретением. Следует отметить, что устройство 10 определения поражения заболеванием может представлять собой устройство, разработанное в качестве специализированной машины, и поражение можно реализовать с помощью универсального компьютера. В этом случае устройство 10 определения поражения заболеванием снабжают центральным блоком обработки (CPU), блоком обработки графики (GPU), памятью и накопителем, таким как привод жесткого диска (не проиллюстрировано), которые предположительно обычно входят в универсальный компьютер. Не стоит и говорить, что различные процессы исполняют посредством программы для того, чтобы управлять этими универсальными компьютерами для того, чтобы выполнять функцию устройства 10 определения поражения заболеванием из данного примера.

[0024] Устройства 10 определения поражения заболеванием включает в себя по меньшей мере блок 11 получения данных образца, блок 12 определения поражения, блок 13 извлечения признака и блок 14 накопителя.

[0025] Блок 11 получения данных образца имеет функцию получения данных образца, в котором уровни экспрессии соответствующих биомаркеров, включая множество типов мкРНК, в полученном у человека образце, регистрируют для каждого индивидуума. Полученный у человека образец относится к образцу, полученному у человека, который может включают в себя биомаркеры, такие как мкРНК из крови, текучего вещества организма, среды клеточной культуры и т.п. Можно использовать любой прием для обнаружения биомаркеров, таких как мкРНК, из этих образцов, но прием, позволяющий обнаруживать все поддающиеся обнаружению биомаркеры, такие как мкРНК, насколько возможно, является более предпочтительным. Устройство обнаружения для биомаркеров может быть встроено в устройство 10 определения поражения заболеванием, или данные образца, обнаруживаемые вовне, можно получать посредством блока 11 получения данных образца через сеть связи. Данные образца для каждого индивидуума имеют, например, элементы данных для 2500 или более типов мкРНК, и каждый элемент мкРНК выполнен из числовых данных, представляющих уровень экспрессии на единичный объем.

[0026] Блок 12 определения поражения включает в себя обученную модель, в которой поражение заболеваниями получают с возможностью определения предварительно посредством выполнения машинного обучения с использованием обучающих данных, и имеет функцию для того, чтобы определять, поражены ли данные образца индивидуума заболеванием, используя обученную модель. Обучающие данные относится к данным образца, к которым прикрепляют маркировочную информацию в отношении поражения заболеваниями. Для того чтобы генерировать обученную модель, благоприятно иметь множество данных образцов пораженных индивидуумов и множество данных образцов непораженных индивидуумов. Следует отметить, что, в дальнейшем описании, описание приведено для случая, в котором машинное обучение представляет собой обучение с использованием нейронной сети в качестве примера, но вариант осуществления не ограничен этим случаем, и применимы различные типы машинного обучения.

[0027] На фиг. 2 представлена пояснительная диаграмма, иллюстрирующая идею обучения в нейронной сети. Как проиллюстрировано на фиг. 2, при обучении с использованием нейронной сети, нейронная сеть выполнена с возможностью получать обучающие данные (данные образца с маркировочной информацией) в качестве ввода и результат определения поражения в качестве вывода. В качестве современного обучения с использованием нейронной сети, например, можно рассматривать управление нейронной сетью для того, чтобы осуществлять процесс получения функции потерь, и обучение для того, чтобы осуществлять определение поражения заболеванием по значению функции потерь. Корректируют параметры нейронной сети по разности между вводимыми данными и результатом определения, осуществляют обучение для того, чтобы усовершенствовать точность определения, и получают обученную модель. Примеры нейронной сети, упоминаемой здесь, включают Feedforward, CNN, VAE, GAN и AAE.

[0028] Блок 18 вычисления важности имеет функцию для того, чтобы вычислять степень важности, которая служит в качестве ориентира того, насколько значение каждого биомаркера в данных образца влияет на определение поражения при выполнении определения поражения для данных образца, используя обученную модель, в блоке 12 определения поражения. Вычисление степени важности является таким же, как количественное определение степени важности в блоке 13 извлечения признака, описанном далее. Следует отметить, что, в случае, когда определение поражения в данных образца осуществляют в блоке 12 определения поражения, также возможно вводить данные образца в обученную модель и выводить только результат определения поражения заболеванием. Даже в этом случае вычисляют степень важности и выполняют определение в обученной модели, но может иметь место случай, когда блок 18 вычисления важности не функционирует независимо. То есть, в настоящем изобретении, случай, когда определение поражения осуществляют в блоке 12 определения поражения, включает случай, когда блок 18 вычисления важности выполняет функцию внутреннего процесса блока 12 определения поражения.

[0029] Блок 13 извлечения признака имеет функцию для того, чтобы извлекать отличительные биомаркеры, относящиеся к заболеваниям. Отличительный биомаркер представляет собой биомаркер, эффективный для определения пораженного индивидуума и непораженного индивидуума заболеванием. Способ извлечения отличительных биомаркеров представляет собой ввод множества данных образцов, к которым прикрепляют маркировочную информацию о поразивших заболеваниях, в обученную модель, обученную в блоке 12 определения поражения, и выполнение определения поражения, количественное определение степеней важности соответствующего признака для множества биомаркеров, которые получают в обученной модели, посредством вычисления определения поражения для каждых данных образца, получение суммы количественно определяемых признаков множества данных образцов для каждого биомаркера и извлечение предварительно определяемого числа биомаркеров из тех, которые имеют большое значение суммы, в качестве отличительных биомаркеров, относящихся к заболеванию.

[0030] Более конкретно, в блоке 13 извлечения признака, степени важности признака соответствующих биомаркеров количественно определяют с помощью процесса вычисления функции потерь Li в отношении i-х данных образца, используя обученную модель, для каждых данных образца, процесса выполнения обратного распространения ошибки со значением Li функции потерь в качестве начальной точки и вычисления градиента gij=∂Li/∂xj в отношении признака xj, соответствующего каждому из множества типов биомаркеров образца i, и процесса получения абсолютного значения суммы градиентов для всех образцов в качестве степени важности Sj=|Σ_{i}gij| признака, биомаркеры ранжируют в нисходящем порядке по степени важности и предварительно определяемое число биомаркеров сверху, например, 100 биомаркеров, извлекают в качестве отличительных биомаркеров.

[0031] Блок 19 вычисления важности признака имеет функцию для того, чтобы вычислять важность признака, которая служит в качестве ориентира того, насколько значение каждого отличительного биомаркера влияет на определение поражения, когда только извлеченный биомаркер используют в качестве элемента вводимых данных, и осуществляют определение поражения, когда отличительный биомаркер извлекают в блоке 13 извлечения признака. В случае, когда биомаркеры ранжируют в нисходящем порядке по степени важности и предварительно определяемое число биомаркеров сверху, например, 100 биомаркеров, извлекают в качестве отличительных биомаркеров, процесс выполнения определения поражения с использованием 100 биомаркеров в качестве ввода обучают посредством нейронной сети, генерируют обученную модель в случае 100 отличительных биомаркеров, и в случае, когда определение поражения в данных образца осуществляют посредством блока 12 определения поражения с использованием обученной модели, важность признака вычисляют посредством блока 19 вычисления важности признака, и осуществляют определение поражения. Также возможно вводить данные образца в обученную модель и выводить только результат определения поражения заболеванием, аналогичным образом случаю блока 18 вычисления важности, описанного выше. Даже в этом случае, вычисляют важность признака и выполняют определение в обученной модели, но могут иметь место случаи, когда блок 19 вычисления важности признака не функционирует независимо. То есть, в настоящем изобретении, случай, когда определение поражения осуществляют в блоке 12 определения поражения, включает случай, когда блок 19 вычисления важности признака выполняет функцию внутреннего процесса блока 12 определения поражения.

[0032] Блок 14 накопителя имеет функцию накопления данных, которые используют в устройстве 10 определения поражения заболеванием, и данных, получаемых в качестве результата обработки. Конкретно, как проиллюстрировано на фиг. 1, накапливают по меньшей мере данные 15 образца, получаемые в блоке 11 получения данных образца, обучающие данные 16, к которым прикрепляют маркировочную информацию в отношении поражения заболеваниями в данных образца, обученную модель 17, сгенерированную посредством машинного обучения с использованием обучающих данных, и т.п.

[0033] Далее поток обработки в устройстве 10 определения поражения заболеванием в соответствии с настоящим изобретением описан со ссылкой на фиг. На фиг. 3 представлена блок-схема, иллюстрирующая поток процесса обучения в устройстве 10 определения поражения заболеванием. Для того чтобы осуществлять определение поражения заболеваниями в блоке 12 определения поражения устройства 10 определения поражения заболеванием, обученную модель предварительно нужно генерировать посредством выполнения обучения посредством нейронной сети. Создание обученной модели можно осуществлять посредством блока 12 определения поражения или обученную модель, которую генерировали отдельно, можно использовать посредством блока 12 определения поражения после хранения в блоке 14 накопителя.

[0034] На фиг. 3, сначала создание обученной модели начинают с получения обучающих данных (стадия S11). Кроме того, тестовые данные также получают по мере необходимости. Тестовые данные представляют собой данные образца, с которыми прикрепляют маркировочную информацию в отношении поражения заболеваниями, подобно обучающим данным, и представляют собой данные образца, отличные от обучающих данных. Предварительную обработку осуществляют на полученных обучающих данных (стадия S12). При предварительной обработке, процесс выбеливания линейного преобразования каждой размерности выполняют так, что усредненное по всем обучающим данным становится 0 и дисперсия становится 1, для каждой размерности вектора признаков из обучающих данных. Затем каждый параметр нейронной сети инициализируют (стадия S13). В качестве способа инициализации, например, возможен способ инициализации каждого параметра с помощью случайного числа. После этого, обучающие данные вводят в инициализированную нейронную сеть и осуществляют обучение (стадия S14). Обучение осуществляют для того, чтобы усовершенствовать точность определения посредством надлежащей модификации параметров так, что результаты определения при определении поражения совпадают с маркировочной информацией обучающих данных. После обучения, чтобы измерять точность определения, перекрестную валидацию можно осуществлять с использованием тестовых данных (стадия S15). Обучение прекращают в момент, когда гарантированно получают обученную модель с определенной точностью определения, обученную модель выводят и процесс прекращают (стадия S16).

[0035] На фиг. 4 представлена блок-схема, иллюстрирующая поток процесса извлечения признака в устройстве 10 определения поражения заболеванием. На фиг. 4, при извлечении признака заболевания, сначала получают множество данных образцов, к которым маркировочная информация, обозначающая пораженных индивидуумов (стадия S21). Предварительную обработку осуществляют для множества полученных данных образцов (стадия S22). При предварительной обработке осуществляют процесс выбеливания при линейном преобразовании каждой размерности так, что усредненное по всем данных образца становится 0 и дисперсия становится 1, для каждой размерности вектора признаков в данных образца. Затем данные образца вводят в обученную модель и выполняют вычисление определения поражения (стадия S23). Вычисление определения поражения, например, представляет собой вычисление функции потерь. Для каждых данных образца, степень важности извлекают для каждого признака данных образца (стадия S24). При извлечении степени важности вычисляют градиент, относящийся к каждому признаку данных образца, и величину градиента количественно определяют в качестве степени важности, например. Затем, для каждого признака, вычисляют сумму степеней важности всех данных образца (стадия S25). Признак ранжируют в нисходящем порядке по абсолютному значению суммы степеней важности, и предварительно определяемое число признака извлекают сверху (стадия S26). Биомаркер, соответствующий извлеченному признаку, извлекают в качестве отличительного биомаркера, относящегося к заболеванию, и процесс прекращают (стадия S27).

[0036] Как описано выше, в соответствии с устройством 10 определения поражения заболеванием по настоящему изобретению, обученную модель генерируют посредством выполнения обучения посредством нейронной сети, используя обучающие данные, имеющие элементы данных множества типов (например, 2500 типов или больше) мкРНК, и определение поражения заболеванием осуществляют с использованием обученной модели и, таким образом, осуществляют обучение, при этом параметры обновляют так, что уровни экспрессии мкРНК, которые значимы для определения поражения в процессе обучения посредством нейронной сети, влияет на определение, в соответствии с чем определение поражения можно точно выполнять, даже если человек предварительно не распознает присутствие мкРНК, связанной с заболеванием.

[0037] Кроме того, в соответствии с устройством 10 определения поражения заболеванием по настоящему изобретению, множество данных образцов, к которым прикрепляют маркировочную информацию о пораженных индивидуумах, вводят в созданную обученную модель и вычисляют определение поражения, степень важности каждого признака данных образца получают в процессе вычисления, абсолютное значение суммы степеней важности всех данных образца получают для каждого признака, признак данных образца ранжируют на основе абсолютного значения суммы степеней важности и биомаркеры, соответствующие предварительно определяемому числу признака сверху, извлекают в качестве отличительных биомаркеров, относящихся к заболеванию, в соответствии с чем важную мкРНК при определении поражения заболеванием можно извлекать в качестве отличительной мкРНК.

[0038] Преимущество извлечения отличительного биомаркера состоит в том, что у компьютера можно снижать необходимую производительность обработки и скорость обработки можно усовершенствовать, при этом сохраняя точность определения поражения. В частности, например, обученная модель, которая выполняла обучение на основе данных об уровнях экспрессии 2500 или больше типов мкРНК, делает возможным высокоточное определение поражения с одной стороны, очень высокая производительность обработки необходима для компьютера для обработки вычислений и время обработки вычислений также велико с другой стороны. Следовательно, например, если верхние 100 отличительных мкРНК извлекают на основе степени важности, обучение осуществляют посредством нейронной сети с использованием данных образца, имеющих верхние 100 мкРНК в качестве элементов данных для того, чтобы генерировать обученную модель, и определение поражения осуществляют с использованием обученной модели, имеет место такое преимущество, что определение поражения можно осуществлять с точностью, сравнимой со случаем определения поражения на основе 2500 типов, можно снижать производительность обработки компьютера для обработки вычислений и можно укорачивать время обработки вычислений.

[0039] В качестве примера усовершенствования точности, в стандартном способе диагностирования злокачественной опухоли молочной железы с использованием пяти типов мкРНК, диагностическая точность составляла 89%, тогда как в приеме определения поражения в соответствии с настоящим изобретением с использованием 2500 типов мкРНК, достигают диагностирования злокачественной опухоли молочной железы с точностью 99,6%, и точность чрезвычайно усовершенствуют.

[0040] Кроме того, в соответствии с приемом определения поражения с использованием верхних 100 типов отличительной мкРНК, извлеченных посредством устройства определения поражения в соответствии с настоящим изобретением, используя 2500 типов мкРНК, диагноз злокачественной опухоли молочной железы возможен с точностью 99,57%, а определение поражения можно выполнять с точностью, сравнимой со случаем использования 2500 типов мкРНК.

[0041] [Второй вариант осуществления] В первом варианте осуществления дано описание с использованием вычисления для получения функции потерь Li в качестве вычисления для определения поражения заболеванием и градиента каждого признака функции потерь Li в качестве степени важности для извлечения признака. Однако настоящее изобретение не ограничено этим примером, и другие примеры описаны во втором варианте осуществления.

[0042] Во втором варианте осуществления, линейный классификатор обучают посредством локальных интерпретируемых независимых от модели объяснений (LIME) и в процессе обучения получают степень важности. Обучение осуществляют для получения обучающих данных в качестве ввода и линейный классификатор в качестве обученной модели в качестве вывода. Для каждых обучающих данных обучают линейное обучаемое средство, которое аппроксимирует обученный предиктор. В этом случае, шум добавляют в данные образца для того, чтобы создавать множество искусственных векторов признаков, и искусственный вектор признаков подают в обученный предиктор для получения виртуальной маркировки (или вероятности распределения для маркировки). Линейный классификатор обучают с использованием полученного искусственного вектора признаков и виртуальной маркировки. Линейный классификатор для маркировки y, полученный таким образом, можно выражать как fi(y|x)=Σjwijxj. По этому линейному классификатору вычисляют степень важности Sj. Например, степень важности Sj вычисляют как Sj=|Σiwij|. Ранжирование осуществляют на основе степени важности Sj, полученной таким образом, и извлекают отличительные биомаркеры, относящиеся к заболеванию.

[0043] Как описано выше, даже если степень важности вычисляют с использованием приема обучения линейного классификатора посредством LIME, можно осуществлять определение поражения с точностью и можно извлекать отличительные биомаркеры.

[0044] [Третий вариант осуществления]

При вычислении для извлечения признака можно получать степень важности каждого признака посредством вычисления посредством послойного распространения релевантности (LRP). Однако в этом приеме предполагают, что предиктор имеет следующие три свойства: (1) имеет нейронную сеть без ветвления; (2) имеет слои с различными размерностями на вводе/выводе размерностей, в слоях в нейронной сети, используемой для предиктора, представляющие собой только все связующие слои; и (3) выводит k-мерный вектор, соответствующий числу k типов маркировок, и i-й вывод, представляющий i-ую вероятность предсказания.

[0045] Степень важности Sij вычисляют для каждых данных образца i и каждого признака j. При вычислении сначала признак данных образца i подают в обученную нейронную сеть и осуществляют прямое распространение. Слои пересекают в обратном порядке от блока вывода и рекурсивно вычисляют вектор важности R, представляющий степень важности в каждом слое. Порядок обработки при вычислении схож со способом обратного распространения ошибки, но вычисление, фактически выполняемое в каждом слое, отличается. j-е значение вектора важности R в блоке ввода (который имеет ту же размерность, что и входной вектор признаков, аналогично способу обратного распространения ошибки) определяют как важность Sij для признака j. После завершения вычисления для всех данных образца, вычисляют степень важности Sj каждого признака j, например, как Sj=|ΣiSij|. Осуществляют ранжирование на основе степени важности Sj, полученной таким образом, и извлекают отличительные биомаркеры, относящиеся к заболеванию.

[0046] Как описано выше, даже если степень важности вычисляют с использованием приема обучения предиктора посредством LRP, можно осуществлять определение поражения с точностью и можно извлекать отличительные биомаркеры.

[0047] В вариантах осуществления с первого до третьего описаны примеры с использованием мкРНК в качестве биомаркеров. Однако что угодно может представлять собой биомаркеры до тех пор, пока их уровни экспрессии можно обнаруживать и количественно в полученном у человека образце. Наиболее значимый признак настоящего изобретения состоит в том, что биомаркеры можно использовать при определении поражения, без распознавания того, что биомаркер действует на заболевание, и, таким образом, не только мкРНК, но также определяемый качественно биомаркер можно использовать без каких-либо проблем.

[0048] В вариантах осуществления с первого до третьего, вычисление для получения абсолютного значения суммы степеней важности множества данных образцов выполняют для каждого признака, соответствующего биомаркеру, как вычисление для того, чтобы извлекать отличительный биомаркер, но настоящее изобретение не ограничено этим. Например, максимальные значения степени важности в множестве данных образцов извлекают для каждого признака, соответствующего биомаркеру, как степени важности признака, степени важности (максимальные значения) каждого извлеченного признака сравнивают, предварительно определяемое число биомаркеров сверху в нисходящем порядке по значению степени важности извлекают в качестве отличительных биомаркеров, относящихся к заболеванию.

[0049] Определение поражения и извлечение признака посредством устройства 10 определения поражения заболеванием, которое описано в вариантах осуществления с первого до третьего, применимы не только к иллюстративной злокачественной опухоли молочной железы, но также к диагностированию различных злокачественных опухолей, а также применимы к различным заболеваниям, отличным от злокачественной опухоли.

[0050] [Четвертый вариант осуществления]

Как описано в первом варианте осуществления, настоящее изобретение можно применять к определению поражения для различных заболеваний. На фиг. 5 представлена таблица, иллюстрирующая точность определения поражения, когда настоящее изобретение применяют для различных заболеваний. Фиг. 5 иллюстрирует результат случая, когда машинное обучение осуществляют на данных образцов пациентов, пораженных заболеваниями, и здоровых субъектов, и определение поражения осуществляют с использованием обученной модели, которая делает возможным определение поражения в множестве типов злокачественных опухолей. Здесь, в качестве примера, описан случай использования множества данных образцов пациентов, пораженных конкретным типом злокачественной опухоли, и множества данных образцов здоровых субъектов, в качестве данных образцов для обучения. Здесь, данные образца пациента, пораженного конкретным типом злокачественной опухоли, например, представляют собой «данные образца пациента, пораженного злокачественной опухолью молочной железы», «данные образца пациента, пораженного злокачественной опухолью предстательной железы», или тому подобное, и маркировку одного типа злокачественной опухоли прикрепляют к одним данным образца. Здесь множество типов злокачественных опухолей, таких как злокачественная опухоль молочной железы и злокачественная опухоль предстательной железы, определяют предварительно в качестве группы заболеваний, и для того, чтобы определять, имеет ли место поражение любым заболеванием в группе заболеваний или не имеет место поражение любым из заболеваний, которые определены в группе заболеваний, используют данные образца пациента, пораженного заболеванием, которое определено в группе заболеваний, и данные образца пациента, не пораженного любым из заболеваний, которые определены в группе заболеваний.

Пациента, не пораженного любым из заболеваний, которые определены в группе заболеваний, лечат как здорового субъекта. В этом случае маркировка, указывающая на тип злокачественной опухоли, не предоставлена, и вместо этого предоставлена маркировка, указывающая на здорового субъекта. (В случае, когда маркировка, указывающая на здорового субъекта, отдельно не предоставлена, и маркировка, указывающая на тип злокачественной опухоли, не предоставлена, данные образца можно определять как данные образца здорового субъекта. Однако, чтобы упрощать описание, взамен предоставляют маркировку, указывающую на здоровый субъект, не предоставляя маркировку, указывающую на тип злокачественной опухоли.)

В результате машинного обучения, когда определение поражения для данных образца конкретного пациента осуществляют с использованием полученной обученной модели, присутствие поражения для множества злокачественных опухолей, такое как «присутствие поражения злокачественной опухолью молочной железы, присутствие поражения злокачественной опухолью предстательной железы, присутствие поражения злокачественной опухолью поджелудочной железы...» определяют независимо и исключительно, и присутствие поражения определяют для одного из типов злокачественных опухолей. Например, для следующих трех злокачественных опухолей выполняют такое определение, как «интенсивность поражения злокачественной опухолью молочной железы составляет 70%, интенсивность поражения злокачественной опухолью предстательной железы составляет 20%, интенсивность поражения злокачественной опухолью предстательной железы составляет 10%, вероятность оказаться здоровым субъектом составляет 0%». Тогда, для этого пациента, выводят результат определения, что пациент поражен злокачественной опухолью молочной железы с наибольшей интенсивностью поражения. Между тем, в случае, когда выполняют определение, такое как «интенсивность поражения злокачественной опухолью молочной железы составляет 10%, интенсивность поражения злокачественной опухолью предстательной железы составляет 5%, интенсивность поражения злокачественной опухолью предстательной железы составляет 5% и вероятность оказаться здоровым субъектом составляет 80%». Пациента определяют, как здорового человека с наибольшей вероятностью. Такой прием в целом называют многоклассовым, и, когда вышеуказанные результаты определения суммируют, получают 100%. На фиг. 5 представлен список, в котором сведена точность определения для типов злокачественных опухолей и доброкачественных заболеваний с помощью такого способа. Следует отметить, что далее описаны подробности о доброкачественных заболеваниях и злокачественных заболеваниях.

Общее число образцов, используемых для определения, на фиг. 5 составляет приблизительно 5000. Как проиллюстрировано на фиг. 5, точность определения для здорового субъекта составляет 99,79%, точность определения для злокачественной опухоли молочной железы составляет 99,72%, точность определения для доброкачественного заболевания молочной железы составляет 100%, точность определения для злокачественной опухоли предстательной железы составляет 99,16%, точность определения для доброкачественного заболевания предстательной железы составляет 99,16%, точность определения для злокачественной опухоли поджелудочной железы составляет 99,10%, точность определения для злокачественной опухоли желчных путей составляет 99,06%, точность определения для злокачественной опухоли ободочной кишки составляет 99,61%, точность определения для злокачественной опухоли желудка составляет 99,61%, точность определения для злокачественной опухоли пищевода составляет 99,70%, точность определения для злокачественной опухоли печени составляет 99,85%, точность определения для доброкачественного панкреатического заболевания составляет 99,74%, и определение поражения для различных заболеваний можно осуществлять с очень высокой точностью.

[0051] Кроме того, в качестве признака настоящего изобретения, определение поражения можно осуществлять не только для злокачественных заболеваний, но также для доброкачественных заболеваний. Как проиллюстрировано на фиг. 5, взаимосвязи между злокачественной опухолью молочной железы и доброкачественным заболеванием молочной железы, между злокачественной опухолью предстательной железы и доброкачественным заболеванием предстательной железы, помимо злокачественной опухоли поджелудочной железы и злокачественной опухоли желчных путей и доброкачественного панкреатического заболевания, находятся во взаимосвязи между злокачественным заболеванием и доброкачественным заболеванием. То есть, если обучение осуществляют для множества заболеваний во взаимосвязи между злокачественным заболеванием и доброкачественным заболеванием в устройстве определения поражения заболеванием, и эти взаимосвязи определяют одновременно, имеет место эффект, позволяющий определять, представляет ли заболевание собой злокачественное заболевание или доброкачественное заболевание. Например, генерируют обученную модель, в которой можно определять и злокачественную опухоль молочной железы и доброкачественное заболевание молочной железы, используя множество обучающих данных, к которым прикрепляют маркировочную информацию в отношении поражения соответствующими заболеваниями с тем, чтобы можно было определять и злокачественную опухоль молочной железы, и доброкачественное заболевание молочной железы. Если определение поражения осуществляют с использованием этой обученной модели, злокачественную опухоль молочной железы и доброкачественное заболевание молочной железы можно различать и определять с высокой точностью. С помощью этого процесса можно точно различать злокачественное новообразование и доброкачественное новообразование. Например, при злокачественной опухоли молочной железы, очень сложно проводить различия между злокачественным новообразованием и доброкачественным новообразованием с помощью любого стандартного диагностического способа, в частности, это невозможно на ранней стадии. Следовательно, имеет место такая проблема, что молочная железа может подвергаться резекции, даже если имеет место возможность доброкачественного новообразования. Однако в соответствии с определением поражения заболеванием по настоящему изобретению, различают злокачественное новообразование и доброкачественное новообразование, чтобы тем самым осуществлять подходящее лечение без резекции частей, имеющих доброкачественные возможности. В этом отношении, можно говорить, что влияние на QOL пациента огромно, и это является прорывным изобретением.

[0052] Для того чтобы реализовать устройство определения поражения для осуществления определения поражения множеством заболеваний одновременно, множество данных образцов, к которым прикрепляют маркировочную информацию, указывающую на поражение любым из множества заболеваний, получают в качестве обучающих данных для генерации обученной модели. Например, как проиллюстрировано на фиг. 5, чтобы генерировать обученную модель для осуществления определения поражения одновременно для всех 12 типов, включая 11 типов заболеваний и 1 тип, обозначающий здорового субъекта, в том числе здоровье, злокачественную опухоль молочной железы, доброкачественное заболевание молочной железы, злокачественную опухоль предстательной железы, доброкачественное заболевание предстательной железы, злокачественную опухоль поджелудочной железы, злокачественную опухоль желчных путей, злокачественную опухоль ободочной кишки, злокачественную опухоль желудка, злокачественную опухоль пищевода, злокачественную опухоль печени, доброкачественное панкреатическое заболевание, получают множество данных образцов пациентов, пораженных любым из 11 типов заболеваний, и данные образца, к которым прикрепляют маркировочную информацию об 11 заболеваниях. Кроме того, также получают множество данных образцов здоровых пациентов, к которым маркировочную информацию прикрепляют только к маркировочному элементу для здорового субъекта, не пораженного 11 заболеваниями. Полагая, что маркировочную информацию выражают с помощью флагов «0» и «1» в данных образца пациента, пораженного злокачественной опухолью молочной железы, «1» задают только для маркировочного элемента злокачественной опухоли молочной железы и «0» задают для всех маркировочных элементов других 10 заболеваний.

[0053] Обучение осуществляют, чтобы иметь возможность выводить результат определения поражения, который является таким же, как маркировочная информация, используя множество данных образцов, к которым прикрепляют маркировочную информацию об 11 типах заболеваний, и множество данных образцов здоровых субъектов, в которых маркировочную информацию прикрепляют только к маркировочному элементу для здорового субъекта, не пораженного 11 типами заболеваний, полученным как описано выше, чтобы получать обученную модель. В процессе обучения, в случае нейронной сети, можно осуществлять многозадачное обучение, такое как совместное использование нижнего слоя (слоя, близкого ко вводу) нейронной сети для индивидуальных задач. При многозадачном обучении, знание, получаемое в задачах индивидуального предсказания, можно совместно использовать для нескольких задач и можно ожидать усовершенствования точности.

[0054] Следует отметить, что обученная модель не ограничена случаем выполнения определения поражения для всех 11 типов одновременно, и обученная модель может представлять собой обученную модель, в которой возможно определение поражения только двух типов злокачественной опухоли молочной железы и доброкачественного заболевания молочной железы, обученную модель, в которой возможно определение поражения только двумя типами злокачественной опухоли предстательной железы и доброкачественного заболевания предстательной железы, обученную модель, в которой возможно определение поражения тремя типами злокачественной опухоли поджелудочной железы, злокачественной опухоли желчных путей и доброкачественного панкреатического заболевания, или обученную модель, в которой возможно одновременное определение поражения большим числом заболеваний, чем 11 заболеваний.

[0055] Кроме того, в приведенном выше описании варианта осуществления, множество данных образцов, к которым прикрепляют маркировочную информацию, указывающую на поражение любым одним из множества заболеваний, получали в качестве обучающих данных для генерации обученной модели, и в этом случае определение поражения основано на допущении о том, что пациент поражен только конкретным типом из множества типов злокачественных опухолей, или пациент не поражен каким-либо из множества типов злокачественных опухолей. Однако существуют случаи, когда пациент поражен множеством типов злокачественных опухолей из-за метастатической злокачественной опухоли или тому подобного. В этом случае, определение поражения можно осуществлять посредством модификации способа создания маркировки данных образцов, подлежащих использованию в качестве обучающих данных, и применения приема, схожего с описанным выше вариантом осуществления. В качестве примера, в случае, когда пациент поражен злокачественной опухолью легких и злокачественной опухолью желудка, получают обучающие данные образца, имеющие маркировочные элементы, соответствующие злокачественной опухоли легких и злокачественной опухоли желудка, которые установлены на «1», и другие маркировочные элементы, которые установлены на «0», и обученную модель создают посредством машинного обучения, а определение поражения осуществляют с использованием обученной модели. Эти приемы называют множественной маркировкой, и они оказывают эффект на осуществление определения поражения для одной или нескольких злокачественных опухолей посредством одного определения, посредством прикрепления маркировок, указывающих на множество различных злокачественных заболеваний, к обучающим данным образцов и создания обученной модели посредством выполнения машинного обучения.

[0056] С использованием устройства определения поражения и обученной модели, полученной, как описано выше, определение поражения злокачественными заболеваниями и доброкачественными заболеваниями можно осуществлять одновременно, или определение поражения множеством заболеваний можно осуществлять одновременно при одном исследовании.

[0057] [Пятый вариант осуществления] Несмотря на то, что устройство определения поражения в вариантах осуществления с первого до четвертого может выводить заключения в отношении того, поражен ли пациент заболеванием, посредством ввода данных образца пациента в обученную модель, биомаркеры, которые влияют на определение для достижения заключения, не могут быть получены. Однако существует возможность роста потребности знать, какие биомаркеры влияют на определение, чтобы врач мог узнавать причину, на которой основано заключение, или чтобы врач мог объяснить пациенту причину, на которой основано заключение.

[0058] Следовательно, при вводе данных образца пациента, подлежащих определению поражения, в обученную модель и выполнении определения поражения, можно вычислять степень важности каждой размерности признака, соответствующей биомаркеру, и биомаркер, вносящий вклад в заключение об определении поражения, можно извлекать и выводить на основе величины значения степени важности.

[0059] Степень важности каждой размерности признака, соответствующей биомаркеру, вычисляют как градиент gj в отношении признака xj, с помощью процесса вычисления функции потерь L, используя обученную модель, для данных образца, и процесса выполнения обратного распространения ошибки с использованием значения L функции потерь в качестве начальной точки и вычисления градиента gj=∂L/∂xj для признака xj, соответствующего каждому из множества типов биомаркеров. Вычисление градиента здесь схоже с таковым для первого варианта осуществления. Однако здесь градиент отличается от первого варианта осуществления в том отношении, что градиент вычисляют только для данных образца одного пациента, вместо вычисления суммы множества данных образцов.

[0060] Кроме того, степень важности можно вычислять посредством обучения линейного классификатора посредством локальных интерпретируемых независимых от модели объяснений (LIME), и степень важности получают в процессе обучения. Как описано во втором вариант осуществления, линейный классификатор для маркировки y, полученный посредством выполнения обучения с помощью LIME, можно выражать как fi(y|x)=Σjwijxj. В случае, когда имеют место одни данные образца пациента, подлежащие определению поражения, i для числа образцов равно 1, и таким образом степень важности для признака xj можно вычислять с помощью wj. То есть, линейное обучаемое средство, которое аппроксимирует обученную модель в блоке 12 определения поражения, обучают с помощью LIME, и коэффициент линейного обучаемого средства, соответствующий размерности признака каждого биомаркера в случае, когда данные образца пациента, подлежащие определению поражения, вводят в линейное обучаемое средство, получают в качестве степени важности каждого биомаркера.

[0061] Кроме того, для вычисления степени важности, степень важности каждого признака можно получать, например, посредством вычисления с помощью послойного распространения релевантности (LRP). Как описано в третьем варианте осуществления, при вычислении посредством LRP, признак данных образца пациента, подлежащий определению поражения, предоставляют в обученную нейронную сеть и осуществляют прямое распространение. Слои пересекают в обратном порядке от блока вывода, и рекурсивно вычисляют вектор важности R, который представляет степень важности в каждом слое, в соответствии с чем вектор важности R можно вычислять в качестве степени важности каждой отличительной размерности признака для биомаркера.

[0062] Описанные выше три способа вычисления степени важности являются примерами, и другие способы можно использовать до тех пор, пока способы позволяют вычислять степень важности для каждого биомаркера данных образца пациента, подлежащих определению поражения.

[0063] Как описано выше, степень важности вычисляют для каждого биомаркера данных образца пациента, подлежащих определению поражения, биомаркер, вносящий вклад в заключение об определении поражения, извлекают на основе вычисляемой степени важности и маркер выводят из блока вывода определения вклада биомаркера. Извлечение биомаркеров, вносящих вклад в заключение, можно осуществлять посредством вывода предварительно определяемого числа биомаркеров сверху в нисходящем порядке по значению степени важности, или с использованием способа отображения тепловой карты, или можно рассматривать тому подобное.

[0064] Таким образом, биомаркер, вносящий вклад в заключение, выводят из блока вывода определения вклада биомаркера вместе с результатом определения поражения, в соответствии с чем биомаркер, который вносит вклад в определение поражения, может быть представлен каждому индивидуальному пациенту и, таким образом, биомаркер можно описывать как основу для определения, когда врач сообщает результат определения поражения пациенту. Кроме того, врач может узнавать причину, по которой сделано заключение. Кроме того, зная биомаркер, который является основой для определения поражения, также существует возможность использования в способе индивидуального выбора способа лечения в соответствии с биомаркером, вносящим вклад в определение в будущем.

[0065] [Шестой вариант осуществления]

В вариантах осуществления с первого до третьего способ вычисления на основе вычисления градиент, LIME, LRP и т.п. описаны в качестве способа вычисления степени важности в блоке 13 извлечения признака, а степень важности вычисляли посредством получения абсолютного значения суммы множества данных образцов. Однако способ вычисления не ограничен способом вычисления на основе абсолютного значения суммы. Например, степень важности можно вычислять с использованием способа вычисления нормы L1, нормы L2, нормы LP, которая является обобщением указанных выше норм, и т.п.

[0066] То есть в устройстве извлечения признака заболевания, в котором предусмотрен блок получения данных образца, выполненный с возможностью получения данных образца, причем соответствующие уровни экспрессии биомаркеров, включая множество типов мкРНК, в полученном у человека образце регистрируют для каждого индивидуума, блок определения поражения, содержащий обученную модель, причем поражение заболеваниями получают с возможностью определения предварительно посредством выполнения машинного обучения с использованием обучающих данных, и блок извлечения признака, выполненный с возможностью вводить множество данных образцов, к которым прикрепляют маркировочную информацию о поражении заболеванием, в блок определения поражения для того, чтобы определять поражение, чтобы получать степени важности соответствующего признака множества биомаркеров, полученных с использованием обученной модели, посредством вычисления определения поражения, для каждых данных образца, и чтобы извлекать предварительно определяемое число биомаркеров в качестве отличительных биомаркеров, относящихся к заболеванию, на основе числовых значений степени важности множества данных образцов, для каждого биомаркера, процесс извлечения предварительно определяемого числа биомаркеров, важных при определении поражения заболеванием, в нисходящем порядке на основе величины степени важности, например, верхних 100 биомаркеров, становится возможным при использовании не только абсолютного значения суммы, но также способа вычисления нормы L1, нормы L2 и нормы LP, которая представляет собой обобщение указанных выше норм, в качестве способа вычисления степени важности на основе вычисления градиента, LIME, LRP или тому подобного в блоке извлечения признака.

[0067] В качестве преимуществ извлечения важных биомаркеров при определении поражения заболеванием, можно ожидать эффект, оказываемый на нахождение биомаркера, специфичного для заболевания, посредством извлечения отличительного биомаркера каждого заболевания и выполнения сравнения среди множества заболеваний, и можно ожидать эффект триггера, оказываемый на нахождения неизвестной релевантности между отличительным биомаркером и заболеванием, в дополнение к эффекту снижения производительности обработки, которое необходимо для компьютера, и усовершенствования скорости обработки, при этом сохраняя точность определения поражения, описанную в первом варианте осуществления.

[0068] [Седьмой вариант осуществления]

В вариантах осуществления с первого до шестого описание дано на примере использования нейронной сети в качестве обучаемой машины, которая конфигурирует обученную модель, но обучаемая машина не ограничена нейронной сетью, и различные приемы, такие как градиентный бустинг, случайный лес (лес принятия решений), дополнительные деревья, способ опорных векторов, логистическая регрессия или способ K ближайших соседей, можно использовать в качестве обучаемой машины. В обучаемой машине, отличной от нейронной сети, способ обратного распространения ошибки нельзя применять при вычислении степени важности. Следовательно, в таком случае, степень важности можно вычислять посредством вычисления градиента посредством численного дифференцирования.

[0069] [Восьмой вариант осуществления]

В вариантах осуществления с первого до седьмого, описана конфигурация для того, чтобы вводить данные образца пациента, подлежащие определению поражения, в устройство определения поражения заболеванием, состоящем из одной обученной модели, и выполнять определение поражения в блоке 12 определения поражения, состоящем из обученной модели. Однако настоящее изобретение не ограничено этими примерами. Предсказание определения поражения можно осуществлять с помощью каждой из множества обучаемых машин, и результат определения поражения можно получать посредством стэкинговой обучаемой машины, которая выводит результат определения на основе множества получаемых результатов предсказания.

[0070] На фиг. 6 представлена блочная диаграмма, иллюстрирующая конфигурацию устройства 22 определения поражения заболеванием, в котором используют прием стэкинга. На фиг. 6 обучаемые машины 201, 202,... и 20n представляют собой различные типы обучаемых машин. Тип обучаемых машин 201, 202,... и 20n включает нейронную сеть, градиентный бустинг, случайный лес (лес принятия решений), дополнительные деревья, способ опорных векторов, логистическую регрессию, способ K ближайших соседей и т. п. Кроме того, обучаемая машина может различно использовать Feedforward, CNN, VAE, GAN, AAE и т. п., которые представляют собой нейронные сети. Обучаемые машины 201, 202,... и 20n конфигурируют по обученной модели, которую обучали предварительному определению поражения для того же заболевания, на основе тех же обучающих данных. Чтобы использовать прием стэкинга, нужно использовать по меньшей мере две или больше обучаемых машин различных типов.

[0071] Стэкинговую обучаемую машину 21 конфигурируют по обученной модели, которую предварительно обучали выводить конечный результат определения поражения относительно данных образца пациента, подлежащих определению поражения, с использованием множества результатов предсказания, выводимых соответствующими обучаемыми машинами 201, 202,... и 20n. Стэкинговая обучаемая машина 21 может представлять собой любое из нейронной сети, градиентного бустинга, случайного леса (леса принятия решений), дополнительных деревьев, способа опорных векторов, логистической регрессии, способа K ближайших соседей и т.п.

[0072] Как проиллюстрировано на фиг. 6, устройство 22 определения поражения заболеванием, в котором используют прием стэкинга, сначала вводит данные образца пациента, подлежащие определению поражения, в каждую из множества обучаемых машин 201, 202,... и 20n. Каждая из множества обучаемых машин 201, 202,... и 20n выводит результат предсказания в отношении поражения заболеванием на основе каждой обученной модели. Множество результатов предсказания вводят в стэкинговую обучаемую машину 21. Стэкинговая обучаемая машина 21 выводит конечный результат определения поражения на основе множества результатов предсказания.

[0073] Как описано выше, используя устройство 22 определения поражения заболеванием, в котором используют прием стэкинга, точность определения можно усовершенствовать по сравнению с определением поражения с помощью одной обучаемой машины. Это обусловлено тем, что обучаемые машины имеют возможность иметь сильные и слабые точки при улавливании признака данных образца в зависимости от типов обучаемых машин. В отличие от этого, в соответствии с устройством определения поражения 22, в котором используют стэкинг, стэкинговая обучаемая машина 21 обучается взаимодействию и сильным и слабым точкам соответствующих обучаемых машин, и, таким образом, можно осуществлять конечное определение поражения, отражающее взаимодействие и сильные и слабые точки, в соответствии с чем точность определения можно усовершенствовать по сравнению со случаем одной обучаемой машины, соответственно.

[0074] [Девятый вариант осуществления]

В вариантах осуществления с первого до седьмого дано описание устройства определения поражения заболеванием, содержащего одну обучаемую машину. Однако можно осуществлять комплексное обучение с использованием результатов предсказания, соответственно предсказанных с помощью множества обучаемых машин. Комплексное обучение представляет собой прием получения геометрического среднего вероятностей предсказания, соответственно, выводимых множеством обучаемых машин, и вывода конечного результата предсказания. Множество обучаемых машин могут быть одного и того же типа или можно использовать обучаемые машины различных типов. Посредством выполнения такого комплексного обучения можно усовершенствовать точность определения поражения заболеваниями. Кроме того, комплексное обучение можно применять в устройстве 22 определения поражения заболеванием, в котором используют прием стэкинга, описанный в восьмом варианте осуществления. В этом случае получают множество стэкинговых обучаемых машин 21, получают геометрическое среднее выводов результатов предсказания для множества стэкинговых обучаемых машин 21 и выводят конечный результат предсказания, в соответствии с чем точность определения поражения заболеваниями можно усовершенствовать.

[0075] В приведенном описании варианта осуществления дано описание с помощью мкРНК в реактиве, полученном у человека, в качестве репрезентативного организма, но разумеется, что человек, имеющий обычные знания в области, к которой относится изобретение, может повышать точность определения поражения схожими заболеваниями, используя прием, схожий с настоящим вариантом осуществления, в организмах, отличных от человека, таких как животные, включая домашних и сельскохозяйственных животных.

[0076] [Приложение]

Описанный выше вариант осуществления описан так, что человек, имеющий обычные знания в области, к которой относится изобретение, может выполнять изобретение.

[1] Устройство определения поражения заболеванием, содержащее:

блок получения данных образца, выполненный с возможностью получения данных образца, включающие соответствующие уровни экспрессии биомаркеров, в том числе множество типов мкРНК, в образце, полученном из индивидуального организма;

обученную модель, в которой поражение заболеваниями получают с возможностью определения предварительно посредством выполнения машинного обучения с использованием обучающих данных; и

блок определения поражения, выполненный с возможностью осуществлять определение поражения для данных образца на основе степени важности каждого биомаркера, используя обученную модель.

[2] Устройство определения поражения заболеванием, содержащее:

блок получения данных образца, выполненный с возможностью получения данных образца, включающих в себя соответствующие уровни экспрессии биомаркеров, включая множество типов мкРНК, в образце, полученном из индивидуального организма;

обученную модель, в которой определяется поражение заболеваниями, полученную предварительно посредством выполнения машинного обучения с использованием обучающих данных;

блок вычисления важности, выполненный с возможностью вводить данные образца в обученную модель для того, чтобы количественно определять степень важности каждого биомаркера; и

блок определения поражения, выполненный с возможностью осуществлять определение поражения для данных образца по степени важности.

[3] Устройство определения поражения заболеванием в соответствии с [1] или [2], содержащее:

блок извлечения признака, выполненный с возможностью извлекать отличительный биомаркер, относящийся к заболеванию, на основе степени важности, причем

определение поражения осуществляют на основе важности признака, которая представляет собой степень важности каждого отличительного биомаркера в случае выполнения определения заболевания с использованием только извлеченного отличительного биомаркера.

[4] Устройство определения поражения заболеванием в соответствии с [1] или [2], содержащее:

блок извлечения признака, выполненный с возможностью извлекать отличительный биомаркер, относящийся к заболеванию, на основе степени важности; и

блок вычисления важности признака, выполненный с возможностью количественно определять важность признака, которая представляет собой степень важности каждого отличительного биомаркера в случае выполнения определения заболевания с использованием только извлеченного отличительного биомаркера, причем

блок определения поражения выполняет определение поражения по важности признака.

[5] Устройство определения поражения заболеванием в соответствии с любым одним из [2]-[4], в котором

блок вычисления важности количественно определяет степени важности признаков соответствующих биомаркеров с помощью процесса вычисления функции потерь Li в отношении i-х данных образца, используя обученную модель, для каждых данных образца, процесса выполнения обратного распространения ошибки с использованием значения Li функции потерь в качестве начальной точки и вычисления градиента gij=∂Li/∂xj в отношении признака xj, соответствующего каждому из множества типов биомаркеров образца i, и процесса получения абсолютного значения суммы градиентов для всех образцов в качестве степени важности Sj=|Σ_{i}gij| признака.

[6] Устройство определения поражения заболеванием в соответствии с любым одним из [1]-[5], причем

обучающие данные представляют собой данные образца, к которым прикрепляют маркировочную информацию в отношении того, поражены ли индивидуумы заболеваниями.

[7] Устройство определения поражения заболеванием в соответствии с [6], причем

создание обученной модели осуществляют после осуществления процесса выбеливания, процесс выбеливания представляет собой линейное преобразование каждой размерности так, что усредненное по всем обучающим данным становится 0 и дисперсия становится 1, для каждой размерности вектора признаков из обучающих данных.

[8] Способ определения поражения заболеванием, включающий стадии:

получения данных образца, включающих в себя соответствующие уровни экспрессии биомаркеров, в том числе множества типов мкРНК, в образце, полученном из индивидуального организма;

генерации обученной модели, в которой определяется поражение заболеваниями, получаемой предварительно посредством выполнения машинного обучения с использованием обучающих данных; и

выполнения определения поражения для данных образца на основе степени важности каждого биомаркера, используя обученную модель.

[9] Способ определения поражения заболеванием, включающий стадии:

получения данных образца, включающих в себя соответствующие уровни экспрессии биомаркеров, в том числе множества типов мкРНК, в образце, полученном из индивидуального организма;

генерации обученной модели, в которой определяется поражение заболеваниями, получаемой предварительно посредством выполнения машинного обучения с использованием обучающих данных;

ввода данных образца в обученную модель для того, чтобы количественно определять степень важности каждого биомаркера; и

выполнения определения поражения для данных образца по степени важности.

[10] Способ определения поражения заболеванием в соответствии с [8] или [9], включающий стадию:

извлечения отличительного биомаркера, относящегося к заболеванию, на основе суммы степеней важности, причем

определение поражения осуществляют на основе важности признака, которая представляет собой степень важности каждого отличительного биомаркера, в случае выполнения определения заболевания с использованием только извлеченного отличительного биомаркера.

[11] Способ определения поражения заболеванием в соответствии с [8] или [9], включающий стадии:

извлечения отличительного биомаркера, относящегося к заболеванию, на основе суммы степеней важности; и

количественного определения важности признака, которая представляет собой степень важности каждого отличительного биомаркера, в случае выполнения определения заболевания с использованием только извлеченного отличительного биомаркера, причем

определение поражения осуществляют по важности признака на стадии выполнения определения поражения.

[12] Способ определения поражения заболеванием в соответствии с любым одним из [9]-[11], причем

на стадии вычисления степени важности, степени важности признаков соответствующих биомаркеров количественно определяют с помощью процесса вычисления функции потерь Li в отношении i-х данных образца, используя обученную модель, для каждых данных образца, процесса выполнения обратного распространения ошибки с использованием значения Li функции потерь в качестве начальной точки и вычисления градиента gij=∂Li/∂xj в отношении признака xj, соответствующего каждому из множества типов биомаркеров образца i, и процесса получения абсолютного значения суммы градиентов для всех образцов в качестве степени важности Sj=|Σ_{i}gij| признака.

[13] Способ определения поражения заболеванием в соответствии с любым одним из [8]-[12], в котором

обучающие данные представляют собой данные образца, к которым прикрепляют маркировочную информацию в отношении того, поражены ли индивидуумы заболеваниями.

[14] Способ определения поражения заболеванием в соответствии с [12], в котором

создание обученной модели осуществляют после осуществления процесса выбеливания, процесс выбеливания представляет собой линейное преобразование каждой размерности так, что усредненное по всем обучающим данным становится 0 и дисперсия становится 1, для каждой размерности вектора признаков из обучающих данных.

[15] Устройство извлечения признака заболевания, содержащее:

блок получения данных образца, выполненный с возможностью получения данных образца, в которых соответствующие уровни экспрессии биомаркеров, в том числе множества типов мкРНК, в образце, полученном из индивидуального организма, регистрируют для каждого индивидуума;

блок определения поражения, содержащий обученную модель, причем определяется поражение заболеваниями, полученную предварительно посредством выполнения машинного обучения с использованием обучающих данных; и

блок извлечения признака, выполненный с возможностью вводить множество данных образцов, к которым прикрепляют маркировочную информацию о поражении заболеванием, в блок определения поражения для того, чтобы определять поражение, чтобы количественно определять степени важности соответствующего признака множества биомаркеров, полученных с использованием обученной модели, посредством вычисления определения поражения, для каждых данных образца, и чтобы извлекать предварительно определяемое число биомаркеров в качестве отличительных биомаркеров, относящихся к заболеванию, на основе числовых значений степени важности множества данных образцов, для каждого биомаркера.

[16] Устройство извлечения признака заболевания в соответствии с [15], в котором блок извлечения признака количественно определяет степень важности признаков соответствующих биомаркеров с помощью процесса вычисления функции потерь Li в отношении i-х данных образца, используя обученную модель, для каждых данных образца, процесса выполнения обратного распространения ошибки с использованием значения Li функции потерь в качестве начальной точки и вычисления градиента gij=∂Li/∂xj в отношении признака xj, соответствующего каждому из множества типов биомаркеров образца i, и процесса получения абсолютного значения суммы градиентов для всех образцов в качестве степени важности Sj=|Σ_{i}gij| признака.

[17] Устройство извлечения признака заболевания в соответствии с любым одним из [15]-[16], в котором

обучающие данные представляют собой данные образца, к которым прикрепляют маркировочную информацию в отношении того, поражены ли индивидуумы заболеваниями.

[18] Устройство извлечения признака заболевания в соответствии с любым одним из [15]-[17], в котором

создание обученной модели осуществляют после осуществления процесса выбеливания, процесс выбеливания представляет собой линейное преобразование каждой размерности так, что усредненное по всем обучающим данным становится 0 и дисперсия становится 1, для каждой размерности вектора признаков из обучающих данных.

[19] Устройство извлечения признака заболевания в соответствии с [18], в котором

множество данных образцов, к которым прикрепляют маркировочную информацию о поражении заболеванием, которые используют в блоке извлечения признака, используют после осуществления процесса выбеливания, процесс выбеливания представляет собой линейное преобразование каждой размерности так, что усредненное по всем данных образца становится 0 и дисперсия становится 1, для каждой размерности вектора признаков.

[20] Способ извлечения признака заболевания, включающий стадии:

получения данных образца, в которых соответствующие уровни экспрессии биомаркеров, в том числе множества типов мкРНК, в образце, полученном из индивидуального организма, регистрируют для каждого индивидуума;

генерации обученной модели, в которой определяется поражение заболеваниями, получаемой предварительно посредством выполнения машинного обучения с использованием обучающих данных; и

ввода множества данных образцов, к которым прикрепляют маркировочную информацию о поражении заболеванием, в обученную модель для того, чтобы определять поражение, количественного определения степени важности соответствующего признака множества биомаркеров, полученного с использованием обученной модели, посредством вычисления определения поражения, для каждых данных образца, и извлечения предварительно определяемого числа биомаркеров в качестве отличительных биомаркеров, относящихся к заболеванию, на основе числовых значений степени важности множества данных образцов, для каждого биомаркера.

[21] Устройство определения поражения заболеванием, содержащее:

блок получения данных образца, выполненный с возможностью получения данных образца, включающих в себя соответствующие уровни экспрессии биомаркеров, в том числе множества типов мкРНК, в образце, полученном из индивидуального организма;

обученную модель, в которой определяется поражение заболеваниями, получаемую предварительно посредством выполнения машинного обучения с использованием множества обучающих данных, включая данные образца, каждые включают в себя элементы для идентификации присутствия или отсутствия поражения множеством заболеваний и к которым прикрепляют маркировочную информацию, маркировочная информация указывает, поражены ли индивидуумы любым из заболеваний; и

блок определения поражения, выполненный с возможностью осуществлять определение поражения в отношении того, поражены ли данные образца, подлежащие определению, множеством заболеваний, используя обученную модель.

[22] Устройство определения поражения заболеванием в соответствии с [21], которое дополнительно включает в себя:

блок вывода определения вклада биомаркера, выполненный с возможностью извлекать биомаркер, который вносит вклад в результат определения поражения заболеванием, из биомаркеров, включенных в данные образца, подлежащие определению поражения заболеванием, и выводить извлеченный биомаркер.

[23] Устройство определения поражения заболеванием в соответствии с [22], в котором

блок вывода определения вклада биомаркера вычисляет, с помощью процесса вычисления функции потерь L, используя обученную модель, для данных образца, и процесса выполнения обратного распространения ошибки с использованием значения L функции потерь в качестве начальной точки и вычисления градиента gj=∂L/∂xj для признака xj, соответствующего каждому из множества типов биомаркеров, степень важности каждой размерности признака, соответствующей биомаркеру, в виде градиента gj для признака xj, и извлекает предварительно определяемое число биомаркеров в качестве биомаркеров, которые вносят вклад в результат определения поражения заболеванием, на основе величины степени важности.

[24] Устройство определения поражения заболеванием в соответствии с [22], в котором

блок вывода определения вклада биомаркера обучает линейное обучаемое средство, которое аппроксимирует обученную модель в блоке определения поражения посредством LIME, вычисляет коэффициент линейного обучаемого средства, коэффициент соответствует размерности признака каждого биомаркера, когда данные образца, подлежащие определению поражения, вводят в линейное обучаемое средство, в качестве степени важности каждого биомаркера, и извлекает предварительно определяемое число биомаркеров в качестве биомаркеров, которые вносят вклад в результат определения поражения заболеванием, на основе величины степени важности.

[25] Устройство определения поражения заболеванием в соответствии с [22], в котором

блок вывода определения вклада биомаркера выполняет прямое распространение посредством предоставления признака данных образца пациента, подлежащих определению поражения, в обученную модель в блоке определения поражения посредством LRP, рекурсивно вычисляет вектор важности R, представляющий степень важности в каждом слое, пересекая слои в обратном порядке от блока вывода, вычисляет вектор важности R в качестве степени важности каждой размерности признака, соответствующей каждому биомаркеру, и извлекает предварительно определяемое число биомаркеров в качестве биомаркеров, которые вносят вклад в результат определения поражения заболеванием на основе величины степени важности.

[26] Устройство определения поражения заболеванием, содержащее:

блок получения данных образца, выполненный с возможностью получения данных образца, включающих в себя соответствующие уровни экспрессии биомаркеров, в том числе множества типов мкРНК, в образце, полученном из индивидуального организма;

по меньшей мере две или больше обучаемых машин, выполненных с возможностью осуществлять машинное обучение, обычно используя множество обучающих данных, включающих данные образца, каждые включают в себя элементы для идентификации присутствия или отсутствия поражения множеством заболеваний и к которым прикрепляют маркировочную информацию, маркировочная информация указывает, поражены ли индивидуумы любым из заболеваний, обучаемые машины, соответственно, включают различные типы обученных моделей, которые предварительно обучали для того, чтобы определять поражение одним и тем же заболеванием, обучаемые машины выполнены с возможностью вывода результата предсказания в отношении того, поражены ли данные образца, подлежащие определению поражения заболеванием, заболеванием; и

стэкинговую обучаемую машину, которую обучали предварительно для того, чтобы выводить конечный результат определения, используя результаты предсказания от множества обучаемых машин в качестве вводов, и выполненную с возможностью выводить результат определения в отношении того, поражены ли данные образца, подлежащие определению поражения, заболеванием, на основе результатов предсказания от множества обучаемых машин.

[27] Устройство определения поражения заболеванием в соответствии с любым одним из [21]-[26], причем

множество заболеваний включает по меньшей мере два типа злокачественной опухоли молочной железы, доброкачественного заболевания молочной железы, злокачественной опухоли предстательной железы, доброкачественного заболевания предстательной железы, злокачественной опухоли поджелудочной железы, злокачественной опухоли желчных путей, злокачественной опухоли ободочной кишки, злокачественной опухоли желудка, злокачественной опухоли пищевода, злокачественной опухоли печени и доброкачественного панкреатического заболевания.

[28] Устройство определения поражения заболеванием, содержащее:

множество данных образцов, соответственно полученных от индивидуальных организмов и включающих в себя соответствующие уровни экспрессии множества типов биомаркеров, в том числе мкРНК, в полученных от индивидуальных организмов образцах;

обученную модель, в которой определяется присутствие или отсутствие поражения множеством заболеваний, множество заболеваний выводят как результат машинного обучения с использованием, в качестве обучающих данных, данных образца с маркировочной информацией, в которой элементы для идентификации, поражен ли каждый индивидуальный организм множеством заболеваний, предоставлены в качестве маркировочной информации, для каждых из множества данных образцов; и

блок определения поражения, выполненный с возможностью определять присутствие или отсутствие поражения каждым из множества заболеваний, используя обученную модель, для данных образца, вновь полученных от другого организма, для которых определение поражения подлежит выполнению.

[29] Устройство определения поражения заболеванием, содержащее:

множество данных образцов, соответственно полученных от индивидуальных организмов и включающих в себя соответствующие уровни экспрессии множества типов биомаркеров, в том числе мкРНК, в образце, полученном из индивидуального организма;

обученную модель, в которой присутствие или отсутствие поражения предварительно определяемым заболеванием, предварительно определяемое заболевание выводят как результат машинного обучения с использованием, в качестве обучающих данных, данных образца с маркировочной информацией, в которой элементы для идентификации, поражен ли каждый индивидуальный организм любым одним из предварительно определяемой группы заболеваний, определяемой предварительно, или каждый индивидуальный организм не поражен любым из предварительно определяемой группы заболеваний, определяемой предварительно, в качестве информации, относящейся к заболеванию, при поражении заболеванием, или информации, показывающей, что индивидуальный организм не поражен, когда поражение отсутствует, в качестве маркировочной информации для каждых из множества данных образцов; и

блок определения поражения, выполненный с возможностью определять поражение любым одним из предварительно определяемой группы заболеваний или отсутствие поражения любым из предварительно определяемой группы заболеваний, используя обученную модель, для данных образца, вновь полученных от другого организма, для которых определение поражения подлежит выполнению.

[30] Способ определения поражения заболеванием, включающий стадии:

получения данных образца, включающих в себя соответствующие уровни экспрессии биомаркеров, в том числе множества типов мкРНК, в образце, полученном из индивидуального организма;

генерации обученной модели, в которой возможность поражения множеством заболеваний получают с возможностью определения предварительно посредством выполнения машинного обучения, используя множество обучающих данных, включающих в себя данные образца, каждые включают в себя элементы для идентификации присутствия или отсутствия поражения множеством заболеваний, и к которым прикрепляют маркировочную информацию, маркировочная информация показывает, поражены ли индивидуумы любым из заболеваний; и

выполнения определения поражения в отношении того, поражены ли данные образца, подлежащие определению, множеством заболеваний, используя обученную модель.

[31] Способ определения поражения заболеванием, включающий стадии:

получения данных образца, включающих в себя соответствующие уровни экспрессии биомаркеров, в том числе множества типов мкРНК, в образце, полученном из индивидуального организма;

получения множества результатов предсказания на основе по меньшей мере двух или больше обучаемых машин, выполненных с возможностью осуществлять машинное обучение, обычно используя множество обучающих данных, в том числе данные образца, каждые включают в себя элементы для идентификации присутствия или отсутствия поражения множеством заболеваний и к которым прикрепляют маркировочную информацию, маркировочная информация указывает, поражены ли индивидуумы любым из заболеваний, обучаемые машины, соответственно, включают в себя различные типы обученных моделей, которые обучали предварительно для того, чтобы определять поражение одним и тем же заболеванием, обучаемые машины выполняют с возможностью вывода результата предсказания в отношении того, поражены ли заболеванием данные образца, подлежащие определению поражения заболеванием; и

получения конечного результата определения на основе стэкинговой обучаемой машины, которую обучали предварительно для того, чтобы выводить конечный результат определения, используя результаты предсказания от множества обучаемых машин в качестве вводов, и которая выполнена с возможностью выводить результат определения в отношении того, поражены ли заболеванием данные образца, подлежащие определению поражения, на основе результатов предсказания от множества обучаемых машин.

[32] Способ определения поражения заболеванием, включающий стадии:

получения множества данных образцов, соответственно полученных от индивидуальных организмов и включающих в себя соответствующие уровни экспрессии множества типов биомаркеров, включая мкРНК, в полученных от индивидуальных организмов образцах;

генерации обученной модели, в которой присутствие или отсутствие поражения множеством заболеваний, множество заболеваний выводят как результат машинного обучения с использованием, в качестве обучающих данных, данных образца с маркировочной информацией, причем элементы для идентификации того, поражен ли каждый индивидуальный организм множеством заболеваний, предусмотрены в качестве маркировочной информации, для каждых из множества данных образцов; и

определения присутствия или отсутствия поражения каждым из множества заболеваний, используя обученную модель, для данных образца, вновь полученных от другого организма, для которых определение поражения подлежит выполнению.

[33] Способ определения поражения заболеванием, включающий стадии:

получения множества данных образцов, соответственно получаемых от индивидуальных организмов и включающих в себя соответствующие уровни экспрессии множества типов биомаркеров, включая мкРНК, в образце, полученном из индивидуального организма;

генерации обученной модели, в которой определяется присутствие или отсутствие поражения предварительно определяемым заболеванием, предварительно определяемое заболевание выводят как результат машинного обучения с использованием, в качестве обучающих данных, данных образца с маркировочной информацией, в которой элементы для идентификации, поражен ли каждый индивидуальный организм любым одним из предварительно определяемой группы заболеваний, определяемой предварительно, или каждый индивидуальный организм не поражен любым из предварительно определяемой группы заболеваний, определяемой предварительно, в качестве информации, относящейся к заболеванию, при поражении заболеванием, или информации, указывающей, что индивидуальный организм не поражен, когда поражение отсутствует, в качестве маркировочной информации для каждых из множества данных образцов; и

определения поражения любым одним из предварительно определяемой группы заболеваний или отсутствия поражения любым из предварительно определяемой группы заболеваний, используя обученную модель, для данных образца, вновь полученных от другого организма, для которых определение поражения подлежит выполнению.

[34] Программа определения поражения заболеванием для управления компьютером для того, чтобы реализовать процесс:

получения данных образца, включающих в себя соответствующие уровни экспрессии биомаркеров, в том числе множества типов мкРНК, в образце, полученном из индивидуального организма;

генерации обученной модели, в которой возможность поражения множеством заболеваний получают с возможностью определения предварительно посредством выполнения машинного обучения, используя множество обучающих данных, включающих в себя данные образца, каждые включают в себя элементы для идентификации присутствия или отсутствия поражения множеством заболеваний, и к которым прикрепляют маркировочную информацию, маркировочная информация показывает, поражены ли индивидуумы любым из заболеваний; и

выполнения определения поражения в отношении того, поражены ли данные образца, подлежащие определению, множеством заболеваний, используя обученную модель.

[35] Программа определения поражения заболеванием для управления компьютером для того, чтобы реализовать процесс:

получения данных образца, включающих в себя соответствующие уровни экспрессии биомаркеров, в том числе множества типов мкРНК, в образце, полученном из индивидуального организма;

получения множества результатов предсказания на основе по меньшей мере двух или больше обучаемых машин, выполненных с возможностью осуществлять машинное обучение, обычно используя множество обучающих данных, в том числе данные образца, каждые включают в себя элементы для идентификации присутствия или отсутствия поражения множеством заболеваний и к которым прикрепляют маркировочную информацию, маркировочная информация указывает, поражены ли индивидуумы любым из заболеваний, обучаемые машины, соответственно, включают в себя различные типы обученных моделей, которые обучали предварительно для того, чтобы определять поражение одним и тем же заболеванием, обучаемые машины выполняют с возможностью вывода результата предсказания в отношении того, поражены ли заболеванием данные образца, подлежащие определению поражения заболеванием; и

получения конечного результата определения на основе стэкинговой обучаемой машины, которую обучали предварительно для того, чтобы выводить конечный результат определения, используя результаты предсказания от множества обучаемых машин в качестве вводов, и которая выполнена с возможностью выводить результат определения в отношении того, поражены ли заболеванием данные образца, подлежащие определению поражения, на основе результатов предсказания от множества обучаемых машин.

[36] Программа определения поражения заболеванием для управления компьютером для того, чтобы реализовать процесс:

получения множества данных образцов, соответственно, полученных от индивидуальных организмов и включающих в себя соответствующие уровни экспрессии множества типов биомаркеров, включая мкРНК, в полученных от индивидуальных организмов образцах;

генерации обученной модели, в которой определяется присутствие или отсутствие поражения множеством заболеваний, множество заболеваний выводят как результат машинного обучения с использованием, в качестве обучающих данных, данных образца с маркировочной информацией, причем элементы для идентификации того, поражен ли каждый индивидуальный организм множеством заболеваний, предусмотрены в качестве маркировочной информации, для каждых из множества данных образцов; и

определения присутствия или отсутствия поражения каждым из множества заболеваний, используя обученную модель, для данных образца, вновь полученных от другого организма, для которых определение поражения подлежит выполнению.

[37] Программа определения поражения заболеванием для управления компьютером для того, чтобы реализовать процесс:

получения множества данных образцов, соответственно, полученных от индивидуальных организмов и включающих в себя соответствующие уровни экспрессии множества типов биомаркеров, включая мкРНК, в образце, полученном из индивидуального организма;

генерации обученной модели, в которой определяется присутствие или отсутствие поражения предварительно определяемым заболеванием, предварительно определяемое заболевание выводят как результат машинного обучения с использованием, в качестве обучающих данных, данных образца с маркировочной информацией, в которой элементы для идентификации, поражен ли каждый индивидуальный организм любым одним из предварительно определяемой группы заболеваний, определяемой предварительно, или каждый индивидуальный организм не поражен любым из предварительно определяемой группы заболеваний, определяемой предварительно, в качестве информации, относящейся к заболеванию, при поражении заболеванием, или информации, указывающей, что индивидуальный организм не поражен, когда поражение отсутствует, в качестве маркировочной информации для каждых из множества данных образцов; и

определения поражения любым одним из предварительно определяемой группы заболеваний или отсутствия поражения любым из предварительно определяемой группы заболеваний, используя обученную модель, для данных образца, вновь полученных от другого организма, для которых определение поражения подлежит выполнению.

Список ссылочных позиций

[0077]

10 Устройство определения поражения заболеванием

11 Блок получения данных образца

12 Блок определения поражения

13 Блок извлечения признака

14 Блок накопителя

15 Данные образца

16 Обучающие данные

17 Обученная модель

18 Блок вычисления важности

19 Блок вычисления важности признака

201, 202,..., 20n Обучаемая машина

21 Стэкинговая обучаемая машина

22 Устройство определения поражения заболеванием.

1. Устройство определения поражения заболеванием для выполнения определения поражения множеством заболеваний, возникших во множестве областей тела, причем устройство содержит:

блок получения данных образца, выполненный с возможностью получения данных образца, включающих в себя уровни экспрессии множества типов мкРНК, в образце, полученном из индивидуального организма;

блок определения поражения, выполненный с возможностью ввода данных образца, подлежащих определению, и выполнения определения поражения в отношении того, поражены ли данные образца множеством заболеваний, возникших во множестве областей тела, с использованием обученной модели, в которой поражение для множества заболеваний является определимым и которая была получена заранее посредством выполнения машинного обучения с использованием обучающих данных, включающих в себя множество данных образца, каждые из которых включают в себя элементы для идентификации присутствия или отсутствия поражения множеством заболеваний во множестве областей тела.

2. Устройство определения поражения заболеванием по п. 1, причем:

блок определения поражения определяет, являются ли заболевания злокачественными или доброкачественными.

3. Устройство определения поражения заболеванием по п. 1 или 2, в котором

блок определения поражения выполняет комплексное обучение с использованием множества машин, обучающихся с использованием обученной модели соответственно.

4. Устройство определения поражения заболеванием по любому одному из пп. 1-3, содержащее

блок вывода определения вклада биомаркера, выполненный с возможностью извлекать по меньшей мере один биомаркер, который вносит вклад в определение поражения, из биомаркеров, включенных в данные образца, и выводить извлеченный биомаркер.

5. Устройство определения поражения заболеванием по любому одному из пп. 1-4, в котором блок определения поражения содержит:

по меньшей мере две или более обучаемых машины, каждая из которых сконфигурирована для вывода результатов прогнозирования относительно того, следует ли определять данные образца для заболеваний;

стэкинговую обучаемую машину, которую предварительно обучали для того, чтобы выводить конечный результат определения, используя результаты предсказания от множества обучаемых машин в качестве вводов, и которая выполнена с возможностью выводить результат определения в отношении того, поражены ли множеством заболеваний данные образца, подлежащие определению поражения, на основе результатов предсказания от множества обучаемых машин.

6. Устройство определения поражения заболеванием по любому одному из пп. 1-5, в котором

множество заболеваний включает в себя по меньшей мере два типа злокачественной опухоли молочной железы, доброкачественного заболевания молочной железы, злокачественной опухоли предстательной железы, доброкачественного заболевания предстательной железы, злокачественной опухоли поджелудочной железы, злокачественной опухоли желчных путей, злокачественной опухоли ободочной кишки, злокачественной опухоли желудка, злокачественной опухоли пищевода, злокачественной опухоли печени и доброкачественного панкреатического заболевания.

7. Устройство определения поражения заболеванием по любому одному из пп. 1-6, в котором блок определения поражения определяет

присутствие или отсутствие поражения каждым из множества заболеваний, используя обученную модель, для данных образца, вновь полученных от другого организма, для которых определение поражения подлежит выполнению.

8. Устройство определения поражения заболеванием по любому из пп. 1-7, в котором блок определения поражения определяет поражение любым одним из предварительно определяемой группы заболеваний или отсутствие поражения любым из предварительно определяемой группы заболеваний, используя обученную модель, для данных образца, вновь полученных от другого организма, для которых определение поражения подлежит выполнению.

9. Способ определения поражения заболеванием для выполнения определения поражения множеством заболеваний, возникших во множестве областей тела, осуществляемый компьютером, содержащий этапы:

получения данных образца, включающих в себя уровни экспрессии множества типов мкРНК, в образце, полученном из индивидуального организма; ввода данных образца, подлежащих определению;

выполнения определения поражения в отношении того, поражены ли данные образца множеством заболеваний, которые возникают во множестве областей тела, с использованием обученной модели, в которой поражение множеством заболеваний является определимым и которая была получена заранее посредством выполнения машинного обучения с использованием обучающих данных, включающих в себя множество данных образца, каждые из которых включают в себя элементы для идентификации присутствия или отсутствия поражения множеством заболеваний во множестве областей тела.

10. Способ определения поражения заболеванием по п.9, в котором этап выполнения определения поражения содержит этап

получения конечного результата определения на основе стэкинговой обучаемой машины, которую обучали предварительно для того, чтобы выводить конечный результат определения, используя результат предсказания от множества обучаемых машин в качестве вводов, и которая выполнена с возможностью выводить результат определения в отношении того, поражены ли множеством заболеваний данные образца, подлежащие определению поражения, на основе результатов предсказания от множества обучаемых машин.

11. Способ определения поражения заболеванием по п. 9 или 10, в котором этап выполнения определения поражения содержит этап

определения присутствия или отсутствия поражения каждым из множества заболеваний, используя обученную модель, для данных образца, вновь полученных от другого организма, для которых определение поражения подлежит выполнению.

12. Способ определения поражения заболеванием по любому одному из пп. 9-11, в котором этап выполнения определения поражения содержит этап

определения поражения любым одним из предварительно определяемой группы заболеваний или отсутствия поражения любым из предварительно определяемой группы заболеваний, используя обученную модель, для данных образца, вновь полученных от другого организма, для которых определение поражения подлежит выполнению.

13. Запоминающее устройство, в котором хранятся инструкции, сконфигурированные для побуждения процессора выполнять способ по любому из пп. 9-12.



 

Похожие патенты:
Изобретение относится к молекулярной биологии и генетике. Описан способ прогнозирования рисков тяжелого течения респираторных заболеваний вирусной природы, заключающийся в выделении ДНК человека, определении последовательности ДНК в области полиморфизмов в геноме человека: rs1990760 в гене IFIH1, rs12252 в гене IFITM3, rs1800629 в гене TNF, rs75603675 в гене TMPRSS2, rs7842 в гене C3AR1, rs744166 в гене STAT3, rs324011 в гене STAT6, rs179008 в гене TLR7, rs1799864 в гене CCR2, rs1898830 в гене TLR2, оценке рисков путем присвоения баллов генотипу в области каждого полиморфизма, суммировании этих баллов, при этом сумма баллов = «0» - риск общепопуляционный, сумма баллов меньше «0» – риск повышен, сумма баллов больше «0» – риск снижен.

Изобретение относится к области медицины и биологии. Описан набор синтетических олигонуклеотидов, фланкирующих несколько выбранных участков на РНК коронавируса SARS-CoV2 (праймеры), а также синтетических олигонуклеотидов, несущих в себе флуоресцентную метку и тушитель флуоресценции одновременно (зонды).

Изобретение относится к области медицины и биологии. Описан набор синтетических олигонуклеотидов, фланкирующих несколько выбранных участков на РНК коронавируса SARS-CoV2 (праймеры), а также синтетических олигонуклеотидов, несущих в себе флуоресцентную метку и тушитель флуоресценции одновременно (зонды).

Предложенная группа изобретений относится к области медицины, в частности к иммунологии, патофизиологии и молекулярной биологии. Предложены способ и набор для определения уровня экспрессии гена, кодирующего PEDF кролика Oryctolagus cuniculus методом ПЦР в режиме реального времени.

Изобретение относится к области биохимии, в частности к молекуле рекомбинантной нуклеиновой кислоты, для обеспечения растению устойчивости к насекомым из отрядов чешуекрылых, жесткокрылых и/или полужесткокрылых. Также раскрыты трансформированное растение и его часть, семя, композиция, товарный продукт, содержащие указанную молекулу, полипептид, кодируемый указанной молекулой.

Изобретение относится к биотехнологии и представляет собой способ синтеза заряженного полимера, содержащего по меньшей мере два различных мономера, в наночипе, причем наночип содержит одну или более камер для присоединения, содержащих реагенты для присоединения одного или более мономеров или олигомеров к заряженному полимеру в буферном растворе в форме с защищенными концами, чтобы только один мономер или олигомер мог присоединяться за один цикл реакции; и одну или более резервных камер, содержащих буферный раствор, но не все реагенты, необходимые для присоединения одного или более мономеров или олигомеров, где камеры разделены одной или более мембранами, содержащими одну или более нанопор, и где заряженный полимер может проходить через нанопору и по меньшей мере один из реагентов для присоединения одного или более мономеров или олигомеров не может, при этом способ включает a) перемещение первого конца заряженного полимера, имеющего первый конец и второй конец, под действием электрического притяжения в камеру для присоединения, причем мономеры и олигомеры присоединяются к указанному первому концу в блокированной форме, b) перемещение первого конца заряженного полимера с добавленным мономером или олигомером в блокированной форме в резервную камеру, c) деблокирование присоединенного мономера или олигомера, и d) повторение стадий a-c, где мономеры или олигомеры, присоединенные на стадии a), являются такими же или отличаются, до тех пор пока не получат желаемую последовательность полимера, где заряженный полимер представляет собой ДНК, мономеры представляют собой нуклеотиды, где олигомеры представляют собой олигонуклеотиды и где нанопора имеет диаметр 2-20 нм.

Изобретение относится к области биотехнологии. Описана группа изобретений, включающая антитело против B7-H3 или его антигенсвязывающий фрагмент, фармацевтическую композицию для лечения заболеваний, ассоциированных с B7-H3 позитивными клетками, молекулу нуклеиновой кислоты, кодирующую вышеуказанное антитело или его антигенсвязывающий фрагмент, рекомбинантный вектор для экспрессии антитела или его антигенсвязывающего фрагмента, клетку-хозяин, трансформированную рекомбинантным вектором, для экспрессии антитела или его антигенсвязывающего фрагмента, способ получения антитела или его антигенсвязывающего фрагмента и способ лечения заболеваний, связанных с B7-H3 позитивными клетками.

Группа изобретений относится к области биохимии. Раскрыт биочип для секвенирования нуклеиновых кислот ДНК или РНК, включающий: подложку, включающую совокупность дискретных лунок; гелеобразный материал, размещенный в каждой из дискретных лунок; праймер секвенирования, привитый на гелеобразный материал; и несеквенирующую единицу, привитую на гелеобразный материал и соединенную посредством линкера с гасителем триплетного состояния, антиоксидантом или донором для резонансного переноса энергии флуоресценции (FRET); где и праймер секвенирования, и несеквенирующая единица находятся в той форме, в которой они были привиты, где несеквенирующая единица представляет собой полиэтиленгликоль или PolyT, и где праймер секвенирования и несеквенирующая единица привиты воздействием на подложку раствором или растворами, в которых молярное отношение несеквенирующей единицы к праймеру секвенирования составляет от 0,25:1 до 10:1.

Изобретение относится к способу получения модифицированного олигонуклеотида, включающего олигонуклеотидную часть и полиалкокси часть, применяемого в терапевтических целях. Способ включает: a) активирование карбоксильной группы первого взаимодействующего вещества, включающего полиалкокси часть и карбоксильную группу, реагентом конденсации в смешиваемом с водой органическом растворителе; и b) взаимодействие активированной карбоксильной группы первого взаимодействующего вещества с аминогруппой второго взаимодействующего вещества с получением модифицированного олигонуклеотида.

Изобретение относится к области биотехнологии. Предложены набор и способ для диагностики рака мочевого пузыря с помощью мутаций C228T и C250T в промоторе гена hTERT.

Изобретение относится к микробиологической промышленности, в частности, к аппаратам для выращивания микроорганизмов на природном газе. Аппарат для выращивания микроорганизмов выполнен в виде корпуса с расширенной верхней частью.
Наверх