Способ организации вычислений на графических процессорах для моделирования помехоустойчивости низкоплотностных кодеков

Изобретение относится к автоматизированному проектированию, технике моделирования и проверки кодов и может быть использовано при цифровом моделировании характеристик помехоустойчивых низкоплотностных кодеков в однопроцессорных гетерогенных компьютерных системах малой производительности. Техническим результатом применения способа является увеличение производительности вычислений, производимых в процессе моделирования. Такой результат достигается благодаря тому, что хостовой частью выполняют подготовку и передачу данных GPU части, затем производят предварительную оценку значений производительности вычислений на CPU (TCPU) и GPU (TGPU) в отдельности друг от друга, затем общее число моделируемых точек разбивают в соотношении Q/Z=TCPU/TGPU, после чего часть точек Q моделируют основным потоком вычислений на GPU, синхронизируемых с помощью CPU, и запускают дополнительный поток вычислений на CPU для моделирования части точек Z, по завершении моделирования осуществляют передачу результатов вычислений хостовой части. 2 ил.

 

Изобретение относится к автоматизированному проектированию, технике моделирования и проверки кодов и может быть использовано при цифровом моделировании характеристик помехоустойчивых низкоплотностных кодеков в однопроцессорных гетерогенных компьютерных системах малой производительности для ускорения производимых вычислений.

Техническим результатом является увеличение производительности вычислений, производимых в процессе моделирования.

Известен способ моделирования, описанный в патенте США «Lithographic simulations using graphical processing units», US 2006/0242618 A1, МПК G06F 17/50, опубл. 26.10.2006. Способ заключается в инициализации хостовой части основным вычислителем - CPU (англ. central processing unit - центральный процессор), инициализации данных дополнительного вычислителя - GPU (англ. graphics processing unit - графический процессор), передачи данных от хостовой части к GPU, запуске вычислений на GPU, синхронизируемых хостовой частью и передаче результатов вычислений от GPU обратно хостовой части.

Недостатком такого подхода является неполное использование доступных вычислительных мощностей CPU.

Наиболее близким по своей технической сущности к заявленному способу является способ, описанный в патенте США «Model implementation on GPU», US 7979814 B1, МПК G06F 17/50, опубл. 12.07.2011. Способ заключается в подготовке и передаче хостовой частью данных GPU части, запуске основного потока для CPU и старте потока вычислений на GPU, передаче результатов вычислений хостовой части по завершении моделирования.

Недостатком способа является неполная загрузка основного вычислителя гетерогенной системы вследствие того, что он реализует лишь инициализацию и сопровождение (синхронизацию) вычислений GPU части. В отношении вычислений в гетерогенных системах низкой производительности, такая схема организации моделирования становится схемой с неполным использованием потенциала гетерогенной системы в условиях, когда выигрыш в скорости вычислений на GPU невелик, а гетерогенная система содержит в качестве основного вычислителя лишь однопроцессорное устройство.

Сущность изобретения

Решаемой технической задачей изобретения является увеличение производительности вычислений, выполняемых в процессе моделирования.

Сущность изобретения поясняется приведенными далее чертежами в отношении моделирования и проверки низкоплотностных кодов (N, J, K), где N - длина кода, J - количество единиц в столбце, а K - количество единиц в строке проверочной матрицы кода. На фиг. 1 представлена архитектура программной реализации предлагаемых решений, содержащая в своем составе: 1 - блок моделирования канала с аддитивным белым гауссовским шумом (АБГШ); 2 - блок инициализирующих процедур; 3 и 4 - блоки условной архитектуры итеративного декодера по итеративному алгоритму распространения доверия; 5 - блок финального декодирования и принятия жестких решений, 6 - блок оценки BER (англ. Bit Error Rate - вероятность битовой ошибки). Блоки 3 и 4 в обоих потоках отвечают за передачу сообщений от проверочных вершин к кодовым и обратно, однако в первом потоке, соответствующем вычислениям на GPU, блоки выполняются параллельно, а в потоке, соответствующем вычислениям на CPU, блоки выполняются последовательно.

Предлагаемый способ увеличения производительности заключается в следующем.

1. Сначала производят предварительную оценку производительности вычислений на CPU и GPU в отдельности друг от друга в соответствии с процедурой, псевдокод которой представлен в листинге 1.

Эмпирически было установлено, что моделирование декодирования 200 000 бит достаточно для приблизительной оценки производительности вычислений на CPU и GPU и при этом не так велико, чтобы загрузить гетерогенную систему на значительное время (более 10 сек). Домножение на коэффициент 1, 2 является поправочным; коэффициент вычислен также эмпирически. Функция ceil(x) в листинге 1 возвращает ближайшее целое к значению х, округленное вверх.

2. Затем осуществляют разбиение задачи в соотношении , причем:

Q Z = T C P U T G P U ,

где TCPU и TGPU - время, затраченное на расчеты центральным и графическим процессором в процессе выполнения вышеописанной процедуры соответственно. В отношении моделирования низкоплотностных кодеков разделить задачу оказывается возможным по точкам значений SNR, так как обычно их симулируется достаточное количество. Разбиение вычислительной задачи осуществляют следующим образом: Вводят вспомогательный коэффициент

Вычисляют общее число точек моделирования:

Вычисляют границы интервалов моделирования:

Здесь SNRinit - минимальное значение сигнал/шум; SNRfinal - максимальное значение сигнал/шум; SNRincr - величина инкремента значения сигнал/шум.

3. После этого осуществляют организацию многопоточных вычислений, где моделирование части точек - Q производят основным потоком на вспомогательном вычислителе (GPU) с синхронизацией хостовой (CPU) частью, а моделирование части точек Ζ осуществляют дополнительным потоком вычислений на CPU. Основной поток (GPU, синхронизируемый CPU) моделирует точки SNR1: SNRinit≤SNR1≤SNRQ.

Дополнительный поток (CPU) моделирует точки SNR2: SNRZ≤SNR2≤SNRfinal.

Достигаемое повышение производительности подтверждается программно полученными данными вычислений, представленными на фиг. 2 в виде графика временного выигрыша, в зависимости от длины кода, при моделировании в гетерогенной системе посредством открытого стандарта реализации техники GPGPU (англ. General-purpose graphics processing units - вычислений общего назначения на графических процессорах) OpenCL (англ. Open Computing Language - открытый язык вычислений) характеристик группы кодов (N, 3, 6) при 10 точках SNR (англ. signal-to-noise ratio - отношение сигнал/шум).

Таким образом, при малых значениях длины (N=96) выигрыш достигает 80% и снижается до 60% при N=204 и 41% при N=273. Затем наблюдается установившийся участок со средним значением выигрыша 21% при длине кода от N=504 до N=3000. Говоря об актуальности и практической важности полученных результатов, упомянутые выше значения длины кода рекомендованы следующими современными техническими стандартами в области телекоммуникаций: 802.11 - WiFi (беспроводные локальные и городские сети, N:648-1944); 802.16 - Mobile WiMAX (местные и городские беспроводные сети, N:576-2304); 802.22 - WRAN (беспроводные региональные сети, N:384-2304).

Область применимости способа ограничены условием Q<Maxsim. Стоит отметить, что принципиально способ реализуем и в гетерогенных системах с многопроцессорным CPU, с учетом полной загрузки всех ядер CPU.

Патенты

1. Патент США «Lithographic simulations using graphical processing units», US 2006/0242618 A1, МПК G06F 17/50, опубл. 26.10.2006.

2. Патент США «Model implementation on GPU», US 7979814 B1, МПК G06F 17/50, опубл. 12.07.2011.

Способ организации вычислений на графических процессорах для моделирования помехоустойчивых низкоплотностных кодеков, заключающийся в том, что хостовой частью выполняют подготовку и передачу данных GPU части (англ. graphics processing unit - графический процессор), после чего запускают основной поток вычислений на GPU, синхронизируемый CPU (англ. central processing unit - центральный процессор), и по завершении моделирования осуществляют передачу результатов вычислений хостовой части, отличающийся тем, что перед запуском вычислений на графическом процессоре производят предварительную оценку значений производительности вычислений на CPU (TCPU) и GPU (TGPU) в отдельности друг от друга, затем разбивают общее число точек моделирования в соотношении Q/Z=TCPU/TGPU, после чего часть точек Q моделируют в основном потоке вычислений на GPU, синхронизируемых с помощью CPU, который одновременно моделирует часть точек Ζ в дополнительном потоке вычислений.



 

Похожие патенты:

Изобретение относится к области геофизики и может быть использовано для определения количества углеводородного флюида, присутствующего в породе углеводородсодержащего пласта.

Изобретение относится к способу бурения нефтяной скважины. Технический результат - повышение эффективности бурения скважины.

Изобретение относится к области геофизики и может быть использовано для определения доверительного значения для плоскости развития трещины. В некоторых аспектах выбирают подмножество микросейсмических событий, связанных с операцией гидроразрыва подземной зоны.

Изобретение относится к области геофизики и может быть использовано для отслеживания трещин в процессе гидроразрыва пласта. Предложенные система, способ и программные средства могут быть использованы для анализа микросейсмических данных от операции по разрыву пласта.

Изобретение относится к области геофизики и может быть использовано для отслеживания трещин в процессе гидроразрыва пласта. Предложенные система, способ и программное обеспечение могут использоваться для анализа микросейсмических данных, обусловленных гидроразрывом.

Изобретение относится к области геофизики и может быть использовано для отслеживания трещин в процессе гидроразрыва пласта. Предложенные система, способ и программное обеспечение могут использоваться для анализа микросейсмических данных из подземной зоны.

Изобретение относится к области геофизики и может быть использовано для прогнозирования операционных результатов операции бурения. По меньшей мере некоторыми из иллюстративных вариантов осуществления являются способы, включающие в себя сбор данных датчиков относительно соседних скважин и контекстных данных относительно соседних скважин и размещение данных датчиков и контекстных данных в хранилище данных, создание сокращенного набора данных посредством идентификации корреляции между данными в хранилище данных и операционным результатом в операции бурения, создание модели на основе сокращенного набора данных и прогнозирование операционного результата на основе модели.

Изобретение относится к области геофизики и может быть использовано для исследований трещин в процессе гидроразрыва пласта. Предложенные система, способ и программное обеспечение применимы для вычисления стратиграфии трещин в подземной области.

Изобретение относится к способу и системе прямого моделирования скважинного изображения свойств пласта. Техническим результатом является повышение эффективности прямого моделирования скважинного изображения свойств пласта.

Изобретение относится к способу проектирования многорежимной интеллектуальной системы (МИС) управления распределенной средой мягких вычислений. Технический результат заключается в повышении эффективности проектирования МИС.

Изобретение относится к области геофизики и может быть использовано для отслеживания трещин в процессе гидроразрыва пласта. Предложены система, способ и носитель данных, используемые для анализа микросейсмических данных, собранных при гидравлическом разрыве пласта в подземной зоне. В некоторых аспектах настоящего изобретения каждую базовую плоскость из множества базовых плоскостей задают по подмножеству микросейсмических данных, причем каждая из них имеет ориентацию относительно общей оси. Кластеры ориентаций базовых плоскостей, предварительно выявленных адаптивно по степени изменчивости ориентаций, можно обновить по новым данным. Затем выявляют число ориентаций, связанных с каждым из кластеров. Технический результат - повышение точности и достоверности информации относительно пространственно геометрических характеристик трещин гидроразрыва пласта. 3 н. и 17 з.п. ф-лы, 9 ил.

Изобретение относится к общей области осаждения керамических покрытий, создающих термические барьеры, на детали горячей части газовых турбин, таких, например, как турбореактивные двигатели. Способ оценки для оценки толщины керамического покрытия, создающего термический барьер, которое должно осаждаться с помощью физического осаждения из паровой фазы по меньшей мере из одной мишени (2) на деталь горячей части газовой турбины (3A), установленную на опорном приспособлении, при этом способ включает: стадию (E10) цифрового моделирования геометрической формы детали горячей части и ее перемещений по отношению к мишени; стадию (E20) представления моделируемой детали горячей части как поверхностной сетки и стадию (E50) оценки по меньшей мере для одного элемента сетки детали горячей части, экспонируемой для излучения от мишени во время осаждения покрытия, толщины покрытия, которое должно осаждаться на указанном элементе сетки в данный момент времени, с использованием модели излучения, моделирующей излучение от мишени, и с учетом положения указанного элемента сетки в этот момент времени по отношению к мишени. Технический результат – упрощение способа оценки толщины покрытия в большем количестве точек. 5 н. и 6 з.п. ф-лы, 6 ил.

Группа изобретений относится к способу и системе прогнозирования операций технического обслуживания типовых двигателей летательных аппаратов. Технический результат – повышение точности прогнозирования операций технического обслуживания. Для того предложена система, содержащая: средства инициализации входных данных; средства обработки для сравнения совокупности (М1, Mn) моделей отказов, адаптированных к упомянутому типовому двигателю для выбора соответствующей модели (Mi) отказа с возрастом (T0) отказа, определяющим возраст упомянутого двигателя в момент отказа; средства обработки для связи с упомянутой соответствующей моделью отказа правил (R) принятия решения об уровне объема работ на упомянутом типовом двигателе в зависимости от совокупности (P1, Р2, Pi) параметров, относящихся к упомянутому типовому двигателю; и средства обработки для определения необходимого уровня объема работ (Wf) технического обслуживания упомянутого типового двигателя в зависимости от упомянутых правил принятия решений. 3 н. и 6 з.п. ф-лы, 4 ил.

Способ выполнения инверсии одновременных кодированных источников геофизических данных для оценки параметров модели (41) физических свойств, в особенности приспособленный для обследований без геометрии системы регистрации стационарных приемников, таких как, например, морские сейсмические обследования с перемещающимися источником и приемниками. Функции (32) кодирования, применяемые для источников для формирования одной или более выборок одновременных кодированных источников данных (35), а также для их моделирования (34), являются ортогональными или псевдоортогональными по отношению к взаимной корреляции. Кроме того, приемники также кодируются, при этом кодирование приемника выполнено с возможностью делать определенный приемник менее чувствительным к источникам, которые он не прослушивал в течение обследования (38). Функции кодирования могут быть временными полосовыми фильтрами, отличающимися один от другого по центральной частоте, фазе или по тому и другому. Эффективность способа может быть дополнительно повышена посредством группирования нескольких источников в супер-источник, группирования соответствующих выборок в супервыборку и затем применения вышеописанной стратегии кодирования. 6 н. и 23 з.п. ф-лы, 3 ил.

Изобретение относится к технологиям автоматической идентификации базовой линии на изображении поверхностной сетке аэродинамического профиля для использования в моделировании. Техническим результатом является автоматизированное определение базовой линии аэродинамического профиля. Предложен компьютерно-реализованный способ определения базовой линии на поверхностной сетке аэродинамического профиля для использования в моделировании, причем поверхностная сетка содержит узлы, взаимосвязанные краями. Способ содержит этап, на котором осуществляют определение базовой системы координат, включающей в себя направление X относительно аэродинамического профиля. Также, согласно способу, осуществляют определение переменной по протяженности профиля, которая монотонно изменяется вдоль аэродинамического профиля по прямому направлению движения, которое не совпадает с направлением X. Далее выбирают первый фронтальный узел на базовой линии аэродинамического профиля. Используют алгоритм фронта Парето для определения базовой линии на оконечности поверхностной сетки относительно направления X аэродинамического профиля. 5 н. и 20 з.п. ф-лы, 13 ил.

Изобретение относится к области информационных и телекоммуникационных технологий и может использоваться для проведения полунатурных и стендовых испытаний сложных информационно-управляющих систем на всех этапах жизненного цикла. Технический результат заключается в расширении функциональных возможностей, заключающихся в обеспечении возможности подключения средств связи и обмена данными из состава испытуемой сложной информационно-управляющей системы (СИУС) через стандартные интерфейсы ввода-вывода информации и обеспечении непосредственного подключения к объекту испытаний через стандартные интерфейсы ввода-вывода информации. Технический результат достигается за счет комплекса, который содержит как минимум один вычислитель (11…1N), коммуникатор типовых интерфейсов, объект испытаний, средства связи и обмена данными из состава объекта испытаний, навигационно-временную аппаратуру, проводную и беспроводную локальные вычислительные сети. 2 з.п. ф-лы, 2 ил.

Изобретение относится к области геофизики и может быть использовано при обработке сейсмических данных. Представлено описание способа определения пути движения подземного флюида через геологический объем. Начальный объект находится в геологическом объеме. Начальный объект определяет начальную границу флюида. Точки данных распределены в геологическом объеме. Точки ввода данных связаны со значениями одной или более геологических атрибутов. Способ включает следующие этапы: задание выражения, устанавливающего изменение положения границы флюида в точках данных на протяжении итерации на основании значений одного или более атрибутов и применение этого выражения в точках данных для последовательных итераций с целью изменения границы флюида на протяжении последовательных итераций. Далее путь движения подземного флюида через геологический объем может быть определен по изменению границы флюида. Технический результат – повышение точности получаемых данных. 4 н. и 8 з.п. ф-лы, 8 ил.

Изобретение относится к системе моделирования ядерного реактора. Технический результат заключается в автоматизации моделирования и симуляции ядерного реактора. Система содержит интерфейс моделирования для определения стандартизированных данных моделирования абстрактной модели ядерного реактора, преобразования этих данных в данные моделирования ядерного реактора, определяющие модель ядерного реактора, симулятор, включающий множество модулей симулятора, включающих модуль нейтронного симулятора, модуль симулятора выгорания топлива, модуль термогидравлического симулятора и модуль симулятора характеристик материала, причем симулятор связан с интерфейсом моделирования и сконфигурирован для генерирования данных симуляции для интерфейса моделирования, причем интерфейс моделирования сконфигурирован для избирательной и итерационной посылки данных моделирования ядерного реактора в выбранные модули симулятора для формирования данных симуляции ядерного реактора, приема данных симуляции ядерного реактора, анализа и обновления данных моделирования и данных симуляции для их сохранения, стандартизации обновленных данных моделирования ядерного реактора, базу данных, связанную с интерфейсом моделирования и сконфигурированную для приема стандартизированных данных. 28 з.п. ф-лы, 40 ил., 3 табл.

Изобретение относится к области компьютерного проектирования и может быть использовано при разработке изделий с помощью систем компьютерного моделирования. Техническим результатом является упрощение процесса компоновки, уменьшение числа ошибок, повышение уровня унификации. В способе создают компьютерные модели требуемых промежутков между деталями, причем основная часть геометрии моделей промежутков определяется геометрией разделяемых ими деталей, а компонуемый объект формируется как совокупность компьютерных моделей деталей и промежутков. 4 ил.

Изобретение относится к термогидродинамическим исследованиям нефтяных залежей и может быть использовано для уточнения внутреннего строения массивных трещинных залежей. Способ определения внутреннего строения массивных трещинных нефтяных залежей, включающий предварительное определение эталонной термограммы скважины и последующее последовательное проведение промысловых исследований скважины на стационарных режимах фильтрации, проведение промысловых внутрискважинных исследований с измерением температуры, давления и расхода по стволу скважины с получением фактической термограммы скважины, сравнение фактической термограммы с эталонной, выявление по результатам сравнения аномальных температурных профилей скважины и определение допустимой области возможных значений параметров для каждой трещины, пересекающей ствол скважины, из условия минимального отклонения значений параметров расчетной термограммы от фактической с предварительно заданным уровнем доверия. Задачей изобретения является создание способа исследования внутреннего строения массивных трещинных нефтяных залежей, обеспечивающего получение дополнительных данных о трещинах, пересекающих ствол скважин, в частности более надежных данных о длине, наклоне, ширине и раскрытости трещин. 14 ил., 2 табл.

Изобретение относится к автоматизированному проектированию, технике моделирования и проверки кодов и может быть использовано при цифровом моделировании характеристик помехоустойчивых низкоплотностных кодеков в однопроцессорных гетерогенных компьютерных системах малой производительности. Техническим результатом применения способа является увеличение производительности вычислений, производимых в процессе моделирования. Такой результат достигается благодаря тому, что хостовой частью выполняют подготовку и передачу данных GPU части, затем производят предварительную оценку значений производительности вычислений на CPU и GPU в отдельности друг от друга, затем общее число моделируемых точек разбивают в соотношении QZTCPUTGPU, после чего часть точек Q моделируют основным потоком вычислений на GPU, синхронизируемых с помощью CPU, и запускают дополнительный поток вычислений на CPU для моделирования части точек Z, по завершении моделирования осуществляют передачу результатов вычислений хостовой части. 2 ил.

Наверх