Способ уменьшения вклада технических факторов в суммарный сигнал данных масс-спектрометрии с помощью фильтрации по техническим образцам

Изобретение относится к области медицины. Предложен компьютерно-реализуемый способ удаления липидных признаков со слабым сигналом. Получают технические образцы, в которых отсутствует биологический сигнал, и биологические образцы, в которых присутствует биологический сигнал. На вычислительном устройстве осуществляют сравнение вышеуказанных образцов, при этом установлен порог 0,5 в логарифмической шкале по основанию два, между средними значениями в технических и биологических образцах. Если по меньшей мере один липидный признак имеет разницу меньше чем 0,5 между средним значением в биологических образцах и в технических образцах, то данный липидный признак удаляют из данных. Изобретение обеспечивает уменьшение влияния технических факторов в данных жидкостной хроматографии с масс-спектрометрией посредством удаления липидных признаков со слабым сигналом. 1 ил.

 

ОБЛАСТЬ ТЕХНИКИ

Настоящее техническое решение относится к области медицины, в частности, к способу уменьшения вклада технических факторов в суммарный сигнал данных масс-спектрометрии с помощью фильтрации по техническим образцам.

УРОВЕНЬ ТЕХНИКИ

В уровне техники предложены различные методы корректировки смещения сигнала основываясь на информации о принадлежности батчу или порядку загрузки. Например, в работах [1], [2] описываются методы линейной регрессии на номере загрузки или номере экспериментального батча. Работа [3] использует локально взвешенное сглаживание диаграммы рассеяния. Популярный метод ComBat [4], изначально разработанный для данных секвенирования, основывается на эмпирическом байесовском подходе и на данный момент является популярным методом для коррекции сдвига сигнала области масс-спектрометрии.

Несмотря на существование большого количества подходов, до сих пор не ясно, какой из многочисленных методов работает лучше для решения задачи корректировки смещения сигнала.

Описанные выше методы призваны каждый детектированный липидный признак максимально очистить от нежелательных факторов.

Предлагаемый способ позволяет фильтровать (удалять) некоторые признаки с целью избавления от основной части технического шума.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Технической проблемой, на решение которой направлено заявленное техническое решение, является создание способа уменьшения вклада технических факторов в суммарный сигнал данных масс-спектрометрии с помощью фильтрации по техническим образцам, который охарактеризован в независимом пункте формулы.

Технический результат заключается в уменьшение влияния технических факторов в данных жидкостной хроматографии с масс-спектрометрией, посредством удаления липидных признаков со слабым или отсутствующим сигналом.

Заявленный результат достигается за счет осуществления способа уменьшения вклада технических факторов в суммарный сигнал данных масс-спектрометрии с помощью фильтрации по техническим образцам, содержащий этапы, на которых:

получают технические образцы, в которых отсутствует биологический сигнал, и биологические образцы, в которых присутствует биологический сигнал;

на вычислительном устройстве осуществляют сравнение вышеуказанных образцов, при этом установлен порог 0.5 в логарифмической шкале по основанию два, между средними значениями в технических и биологических образцах;

если по меньшей мере один липидный признак имеет разницу меньше чем 0,5 между средним значением в биологических образцах и в технических образцах, то данный липидный признак удаляют из данных.

ОПИСАНИЕ ЧЕРТЕЖЕЙ

Реализация изобретения будет описана в дальнейшем в соответствии с прилагаемыми чертежами, которые представлены для пояснения сути изобретения и никоим образом не ограничивают область изобретения. К заявке прилагаются следующие чертежи:

Фиг. 1 иллюстрирует пример общей схемы вычислительного устройства.

ДЕТАЛЬНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

В приведенном ниже подробном описании реализации изобретения приведены многочисленные детали реализации, призванные обеспечить отчетливое понимание настоящего изобретения. Однако, квалифицированному в предметной области специалисту, будет очевидно каким образом можно использовать настоящее изобретение, как с данными деталями реализации, так и без них. В других случаях хорошо известные методы, процедуры и компоненты не были описаны подробно, чтобы не затруднять излишне понимание особенностей настоящего изобретения.

Кроме того, из приведенного изложения будет ясно, что изобретение не ограничивается приведенной реализацией. Многочисленные возможные модификации, изменения, вариации и замены, сохраняющие суть и форму настоящего изобретения, будут очевидными для квалифицированных в предметной области специалистов.

Предлагаемый метод основан на теории, что техническим факторам в большой степени подвержены липидные признаки, которые несут мало биологического сигнала. Под липидными признаками понимается количественное измерение некоторого химического соединения в каждом образце заданного эксперимента. В результате эксперимента жидкостной хроматографии с масс-спектрометрии для каждого образца получается спектр. С сырыми спектрами работать нельзя, для этого существуют специализированные программные обеспечения, которые из набора спектров, соответствующих образцам, производят таблицу с признаками. Таким образом, для каждого образца, вместо спектра имеется набор признаков, которое программное обеспечение нашло в данном спектре. Признак соответствует некоторому химическому соединению, и значение признака - количеству этого соединение в данном образце. В процессе пробоподготовки и данного экспериментального метода получаются липидные соединения.

Технические факторы валяют на липидные признаки следующим образом: например, образцы делятся на две группы по значениям какого-то липидного признака, то есть половина образцов имеет большие значения по этому признаку, а другая половина имеет меньшие значения. Однако это разделение связано не с биологическими факторами, а с техническими, такими, как, например, порядок загрузки образца в масс-спектрометр. То есть для заданного липидного признака, его значения подвержены как биологическим факторам, так и не желательным техническим факторам, а итоговый сигнал складывается как сумма этих факторов.

На первом этапе способа получают технические образцы в которых отсутствует биологический сигнал и биологические образцы в которых присутствует биологический сигнал.

Под биологическими образцами понимаются те образцы, для которых необходимо в процессе эксперимента получить липидные измерения. Это может быть образец мозга, или плазмы кровы и/или другой ткани. Биологический образец противопоставляется техническим образцам - это образцы, которые сами по себе не интересны, но добавляются в эксперимент для вспомогательных функций. Данные технические образцы подготавливаются заранее, они проходят все те же этапы пробоподготовки, что и обычные образцы, однако без добавления биологического материала. Для создания тестовых данных были использованы данные проекта Карты Мозга, и программа XCMS для их первичной обработки.

На вычислительном устройстве осуществляют сравнение вышеуказанных образцов, при этом установлен порог 0.5 в логарифмической шкале по основанию два, между средними значениями в технических и биологических образцах. Если по меньшей мере один липидный признак имеет разницу меньше чем 0,5 между средним значением в биологических образцах и в технических образцах, то данный липидный признак удаляют из данных.

Был проведен сравнительный анализ для данных “карты мозга”, это образцы разных регионов мозга человека и человекоподобных обезьян. Для сравнения работы предложенного способа использовалась популярная программа «ComBat»[4], которая призвана очищать липидные признаки от зашумляющих технических факторов. На данных выхода предложенного способа использовалась наивная коррекция, основанная на среднем значении липидных признаков в одном батче образцов (выравнивание среднего сигнала по батчу). Батч эффект возникает, когда небиологические факторы в эксперименте вызывают изменения в данных, полученных в эксперименте.

В качестве метрики использовалось количество значимых признаков между двумя интересующими группами образцов - образцов из первичной коры и вторичной коры головного мозга данных проекта Карты Мозга. В качестве поправки на множественное тестированное мы использовали поправку Бенджамини-Иекутели, а не более известную поправку Бенджамини-Хохберга в связи с тем, что предположение о неотрицательной взаимосвязи тестов может не выполняться в данных масс-спектрометрии. Из 9089 липидных признаков, которые были детектированы в наших данных, по результатам работы программы «ComBat»[4] было получено 506 значимых признаков после поправки на множественное тестирование. По результатам предложенного способа было получено 633 значимых признаков после поправки на множественное тестирование, что соответствует приросту в 25%. Таким образом, предлагаемый способ позволяет извлечь больше полезного сигнала из данных.

На Фиг. 1 далее будет представлена общая схема вычислительного устройства (100), обеспечивающего обработку данных, необходимую для реализации заявленного решения.

В общем случае устройство (100) содержит такие компоненты, как: один или более процессоров (101), по меньшей мере одну память (102), средство хранения данных (103), интерфейсы ввода/вывода (104), средство В/В (105), средства сетевого взаимодействия (106).

Процессор (101) устройства выполняет основные вычислительные операции, необходимые для функционирования устройства (100) или функциональности одного или более его компонентов. Процессор (101) исполняет необходимые машиночитаемые команды, содержащиеся в оперативной памяти (102).

Память (102), как правило, выполнена в виде ОЗУ и содержит необходимую программную логику, обеспечивающую требуемый функционал.

Средство хранения данных (103) может выполняться в виде HDD, SSD дисков, рейд массива, сетевого хранилища, флэш-памяти, оптических накопителей информации (CD, DVD, MD, Blue-Ray дисков) и т.п. Средство (103) позволяет выполнять долгосрочное хранение различного вида информации, например, вышеупомянутых файлов с наборами данных пользователей, базы данных, содержащих записи измеренных для каждого пользователя временных интервалов, идентификаторов пользователей и т.п.

Интерфейсы (104) представляют собой стандартные средства для подключения и работы с серверной частью, например, USB, RS232, RJ45, LPT, COM, HDMI, PS/2, Lightning, FireWire и т.п.

Выбор интерфейсов (104) зависит от конкретного исполнения устройства (N00), которое может представлять собой персональный компьютер, мейнфрейм, серверный кластер, тонкий клиент, смартфон, ноутбук и т.п.

В качестве средств В/В данных (105) в любом воплощении системы, реализующей описываемый способ, должна использоваться клавиатура. Аппаратное исполнение клавиатуры может быть любым известным: это может быть, как встроенная клавиатура, используемая на ноутбуке или нетбуке, так и обособленное устройство, подключенное к настольному компьютеру, серверу или иному компьютерному устройству. Подключение при этом может быть, как проводным, при котором соединительный кабель клавиатуры подключен к порту PS/2 или USB, расположенному на системном блоке настольного компьютера, так и беспроводным, при котором клавиатура осуществляет обмен данными по каналу беспроводной связи, например, радиоканалу, с базовой станцией, которая, в свою очередь, непосредственно подключена к системному блоку, например, к одному из USB-портов. Помимо клавиатуры, в составе средств В/В данных также может использоваться: джойстик, дисплей (сенсорный дисплей), проектор, тачпад, манипулятор мышь, трекбол, световое перо, динамики, микрофон и т.п.

Средства сетевого взаимодействия (106) выбираются из устройства, обеспечивающий сетевой прием и передачу данных, например, Ethernet карту, WLAN/Wi-Fi модуль, Bluetooth модуль, BLE модуль, NFC модуль, IrDa, RFID модуль, GSM модем и т.п. С помощью средств (105) обеспечивается организация обмена данными по проводному или беспроводному каналу передачи данных, например, WAN, PAN, ЛВС (LAN), Интранет, Интернет, WLAN, WMAN или GSM.

Компоненты устройства (100) сопряжены посредством общей шины передачи данных (110).

В настоящих материалах заявки было представлено предпочтительное раскрытие осуществление заявленного технического решения, которое не должно использоваться как ограничивающее иные, частные воплощения его реализации, которые не выходят за рамки испрашиваемого объема правовой охраны и являются очевидными для специалистов в соответствующей области техники.

Источники информации

[1] Kuligowski J, Pérez-Guaita D, Lliso I, Escobar J, León Z, Gombau L, Solberg R, Saugstad OD, Vento M, Quintás G. Detection of batch effects in liquid chromatography-mass spectrometry metabolomic data using guided principal component analysis. Talanta. 2014 Dec;130:442-8. doi:10.1016/j.talanta.2014.07.031. Epub 2014 Jul 18. PubMed PMID: 25159433.

[2] San-Yuan Wang, Ching-Hua Kuo, and Yufeng J. Tseng. Batch Normalizer: A Fast Total Abundance Regression Calibration Method to Simultaneously Adjust Batch and Injection Order Effects in Liquid Chromatography/Time-of-Flight Mass Spectrometry-Based Metabolomics Data and Comparison with Current Calibration Methods. Analytical Chemistry 2013 85 (2), 1037-1046.

[3] Fernández-Albert F, Llorach R, Garcia-Aloy M, Ziyatdinov A, Andres-Lacueva C, Perera A. Intensity drift removal in LC/MS metabolomics by common variance compensation. Bioinformatics. 2014 Oct 15;30(20):2899-905. doi: 10.1093/bioinformatics/btu423. Epub 2014 Jul 2. PubMed PMID: 24990606.

[4] Leek, J. T., Johnson, W. E., Parker, H. S., Jaffe, A. E., & Storey, J. D. (2012). The sva package for removing batch effects and other unwanted variation in high-throughput experiments. Bioinformatics, 28(6), 882-883. http://doi.org/10.1093/bioinformatics/bts034.

Компьютерно-реализуемый способ удаления липидных признаков со слабым сигналом, содержащий этапы, на которых:

получают технические образцы, в которых отсутствует биологический сигнал, и биологические образцы, в которых присутствует биологический сигнал;

на вычислительном устройстве осуществляют сравнение вышеуказанных образцов, при этом установлен порог 0,5 в логарифмической шкале по основанию два, между средними значениями в технических и биологических образцах;

если по меньшей мере один липидный признак имеет разницу меньше чем 0,5 между средним значением в биологических образцах и в технических образцах, то данный липидный признак удаляют из данных.



 

Похожие патенты:

Изобретение относится к аналитической химии и может быть использовано для идентификации и количественного определения экдистероидов в пищевом растительном сырье или экстракте из него по основному экдистероиду 20-гидроксиэкдизону (20Е). Способ идентификации и количественного определения 20Е-экдистероидов в пищевом растительном сырье и экстрактах из него включает многократную экстракцию сырья с последующей высокоэффективной жидкостной хроматографией полученного экстракта с элюированием в градиентном режиме, идентификацию и количественное определение с помощью детектора, при этом пищевое сырье трехкратно экстрагируют 70% раствором этанола на водяной бане при 80°C в течение 4 часов, затем проводят хроматографию с элюированием в градиентном режиме смесью 0,1% раствора муравьиной кислоты в воде и ацетонитрила – элюент Б в следующем режиме: 0 мин - 5% элюента Б, 5 мин - 27% элюента Б, 5,5 мин - 90% элюента Б, 8,5 мин - 90% элюента Б, 9,5 мин - 5% элюента Б, 13,5 мин - 5% элюента Б, при скорости потока 0,4 мл/мин, а идентификацию и количественное определение экдистероидов проводят на тройном квадрупольном масс-детекторе с электроспрейным источником ионизации с переходом масс в МС/МС.

Изобретение относится к аналитической химии и может быть использовано для идентификации и количественного определения экдистероидов в пищевом растительном сырье или экстракте из него по основному экдистероиду 20-гидроксиэкдизону (20Е). Способ идентификации и количественного определения 20Е-экдистероидов в пищевом растительном сырье и экстрактах из него включает многократную экстракцию сырья с последующей высокоэффективной жидкостной хроматографией полученного экстракта с элюированием в градиентном режиме, идентификацию и количественное определение с помощью детектора, при этом пищевое сырье трехкратно экстрагируют 70% раствором этанола на водяной бане при 80°C в течение 4 часов, затем проводят хроматографию с элюированием в градиентном режиме смесью 0,1% раствора муравьиной кислоты в воде и ацетонитрила – элюент Б в следующем режиме: 0 мин - 5% элюента Б, 5 мин - 27% элюента Б, 5,5 мин - 90% элюента Б, 8,5 мин - 90% элюента Б, 9,5 мин - 5% элюента Б, 13,5 мин - 5% элюента Б, при скорости потока 0,4 мл/мин, а идентификацию и количественное определение экдистероидов проводят на тройном квадрупольном масс-детекторе с электроспрейным источником ионизации с переходом масс в МС/МС.

Изобретение относится к области медицины, а именно к гинекологии и онкологии. Для диагностики вируса папилломы человека в образце соскоба из цервикального канала методом газовой хроматографии – масс-спектрометрии определяют концентрации антеизопентадекановой кислоты, 9,10-пентадеценовой кислоты, 10-метилпентадекановой кислоты, 9,10-изогексадеценовой кислоты, 2-гидроксимиристиновой кислоты, 3-гидроксипальмитиновой кислоты и 10-гидроксистеариновой кислоты.

Изобретение относится к области медицины, а именно к гинекологии и онкологии. Для диагностики вируса папилломы человека в образце соскоба из цервикального канала методом газовой хроматографии – масс-спектрометрии определяют концентрации антеизопентадекановой кислоты, 9,10-пентадеценовой кислоты, 10-метилпентадекановой кислоты, 9,10-изогексадеценовой кислоты, 2-гидроксимиристиновой кислоты, 3-гидроксипальмитиновой кислоты и 10-гидроксистеариновой кислоты.

Изобретение относится к области аналитической химии и касается масс-спектрометрического различения изомеров циклических пептидов, содержащих β-гидрокси-N-метиламинокислоты, в том числе идентификации циклоспорина А и его изомера изоциклоспорина А. Сущность способа заключается в регистрации масс-спектра с ионизацией распылением в электрическом поле с дальнейшим анализом фрагментации дважды протонированных ионов.

Изобретение относится к области аналитического приборостроения, а именно к масс-спектрометрии, время-пролетной масс-спектрометрии. Технический результат - увеличение пропускания ионного тока, упрощение конструкции и технологии изготовления.

Изобретение относится к лабораторной диагностике и может быть использовано для получения сухих образцов крови человека и последующего проведения лабораторного анализа для скринингового полуколичественного определения 11 аминокислот и/или токсичных микроэлементов, таких как свинец, кадмий, мышьяк, таллий, ртуть.

Группа изобретений относится к способам оценки качества партии композиции на основе лекарственных трав. Способ оценки качества и потенциальной in vivo активности тестируемой партии композиции на основе лекарственных трав, включающий анализ тестируемой партии композиции на основе лекарственных трав одним или несколькими методами биологического анализа, выбранными из: (a) анализа ответа, связанного с активностью сигнальной трансдукции, который включает измерение ответа, связанного с активностью сигнальной трансдукции, против одного или более сигнальных путей, выбранных из группы, состоящей из TNFa-NFkB, TLR2-NFkB, TLR4-NFkB, IL6-stat3, IFNg-stat1/1, IFNa-stat1/2, DEX-GR, COX-2, iNOS, NRF2, TGFb-Smad2/3, TPA-AP1, CREB, wnt3a-Lef/b-cat, VD3-VDR, ER-alpha, ER-beta, DHT-AR и альдостерона-MR; и (b) анализа экспрессии генов, где анализ экспрессии генов включает количественное определение одного или нескольких генов, кодирующих белки, выбранных из группы, состоящей из ICAM, IRF5, AKR1C1, HO1, GCLC, GCLM, Axin2, GDF15, IGFBP3, OKL38, PIM1, SERTAD, SOS1, BHMT2, CPT1A, SLC7A11, CD24, EMP2 и KRT23; и затем сравнение результатов биологического анализа тестируемой партии с результатами, полученными для известной партии композиции на основе лекарственных трав, которая имеет известный уровень in vivo активности; где, если результаты, полученные для тестируемой партии, имеют коэффициент корреляции от 0,95 до 1,0 с результатами, полученными для известной партии, тестируемую партию определяют как имеющую качество, в достаточной степени соответствующее качеству известной партии, и потенциальную in vivo активность (варианты).

Изобретение относится к пищевой промышленности. Способ раздельного определения органического и неорганического мышьяка в морепродуктах заключается в отборе образцов, их обработке с получением гомогенизированного влажного или сухого образца, которые помещают в пробирки, проведении экстракции каждого образца раствором 3% по массе перекиси водорода в 0,055 М соляной кислоте на деионизованной воде, на водяной бане с шейкером при температуре 95°С в течение 45 мин, затем охлаждении до комнатной температуры, центрифугировании в течение 10 минут при 4000 об/мин, затем перенесении супернатантов в полипропиленовые пробирки с доведением деионизованной водой до объема 10 см3, определении содержания общего мышьяка в 5 см3 отобранного образца супернатанта, разделении мышьяка на органическую и неорганическую фракции в 3 см3 оставшегося количества отобранного образца, причем дополнительно во время проведения экстракции образец подвергают ручному встряхиванию пробирки через каждые 10 мин, а определение количества общего мышьяка, органического и неорганического мышьяка проводят на квадрупольном масс-спектрометре с индуктивно связанной плазмой ICP-MS автоматически.

Изобретение относится к биотехнологии. Предложен способ диагностики вирусов и вирусных инфекций in vitro и in vivo.
Наверх