Способ организации вычислений на графических процессорах для моделирования помехоустойчивости низкоплотностных кодеков



Способ организации вычислений на графических процессорах для моделирования помехоустойчивости низкоплотностных кодеков
Способ организации вычислений на графических процессорах для моделирования помехоустойчивости низкоплотностных кодеков
Способ организации вычислений на графических процессорах для моделирования помехоустойчивости низкоплотностных кодеков
Способ организации вычислений на графических процессорах для моделирования помехоустойчивости низкоплотностных кодеков

 


Владельцы патента RU 2604985:

Федеральное государственное бюджетное образовательное учреждение высшего образования "Воронежский государственный технический университет" (ФГБОУ ВО "ВГТУ", ВГТУ) (RU)

Изобретение относится к автоматизированному проектированию, технике моделирования и проверки кодов и может быть использовано при цифровом моделировании характеристик помехоустойчивых низкоплотностных кодеков в однопроцессорных гетерогенных компьютерных системах малой производительности. Техническим результатом применения способа является увеличение производительности вычислений, производимых в процессе моделирования. Такой результат достигается благодаря тому, что хостовой частью выполняют подготовку и передачу данных GPU части, затем производят предварительную оценку значений производительности вычислений на CPU (TCPU) и GPU (TGPU) в отдельности друг от друга, затем общее число моделируемых точек разбивают в соотношении Q/Z=TCPU/TGPU, после чего часть точек Q моделируют основным потоком вычислений на GPU, синхронизируемых с помощью CPU, и запускают дополнительный поток вычислений на CPU для моделирования части точек Z, по завершении моделирования осуществляют передачу результатов вычислений хостовой части. 2 ил.

 

Изобретение относится к автоматизированному проектированию, технике моделирования и проверки кодов и может быть использовано при цифровом моделировании характеристик помехоустойчивых низкоплотностных кодеков в однопроцессорных гетерогенных компьютерных системах малой производительности для ускорения производимых вычислений.

Техническим результатом является увеличение производительности вычислений, производимых в процессе моделирования.

Известен способ моделирования, описанный в патенте США «Lithographic simulations using graphical processing units», US 2006/0242618 A1, МПК G06F 17/50, опубл. 26.10.2006. Способ заключается в инициализации хостовой части основным вычислителем - CPU (англ. central processing unit - центральный процессор), инициализации данных дополнительного вычислителя - GPU (англ. graphics processing unit - графический процессор), передачи данных от хостовой части к GPU, запуске вычислений на GPU, синхронизируемых хостовой частью и передаче результатов вычислений от GPU обратно хостовой части.

Недостатком такого подхода является неполное использование доступных вычислительных мощностей CPU.

Наиболее близким по своей технической сущности к заявленному способу является способ, описанный в патенте США «Model implementation on GPU», US 7979814 B1, МПК G06F 17/50, опубл. 12.07.2011. Способ заключается в подготовке и передаче хостовой частью данных GPU части, запуске основного потока для CPU и старте потока вычислений на GPU, передаче результатов вычислений хостовой части по завершении моделирования.

Недостатком способа является неполная загрузка основного вычислителя гетерогенной системы вследствие того, что он реализует лишь инициализацию и сопровождение (синхронизацию) вычислений GPU части. В отношении вычислений в гетерогенных системах низкой производительности, такая схема организации моделирования становится схемой с неполным использованием потенциала гетерогенной системы в условиях, когда выигрыш в скорости вычислений на GPU невелик, а гетерогенная система содержит в качестве основного вычислителя лишь однопроцессорное устройство.

Сущность изобретения

Решаемой технической задачей изобретения является увеличение производительности вычислений, выполняемых в процессе моделирования.

Сущность изобретения поясняется приведенными далее чертежами в отношении моделирования и проверки низкоплотностных кодов (N, J, K), где N - длина кода, J - количество единиц в столбце, а K - количество единиц в строке проверочной матрицы кода. На фиг. 1 представлена архитектура программной реализации предлагаемых решений, содержащая в своем составе: 1 - блок моделирования канала с аддитивным белым гауссовским шумом (АБГШ); 2 - блок инициализирующих процедур; 3 и 4 - блоки условной архитектуры итеративного декодера по итеративному алгоритму распространения доверия; 5 - блок финального декодирования и принятия жестких решений, 6 - блок оценки BER (англ. Bit Error Rate - вероятность битовой ошибки). Блоки 3 и 4 в обоих потоках отвечают за передачу сообщений от проверочных вершин к кодовым и обратно, однако в первом потоке, соответствующем вычислениям на GPU, блоки выполняются параллельно, а в потоке, соответствующем вычислениям на CPU, блоки выполняются последовательно.

Предлагаемый способ увеличения производительности заключается в следующем.

1. Сначала производят предварительную оценку производительности вычислений на CPU и GPU в отдельности друг от друга в соответствии с процедурой, псевдокод которой представлен в листинге 1.

Эмпирически было установлено, что моделирование декодирования 200 000 бит достаточно для приблизительной оценки производительности вычислений на CPU и GPU и при этом не так велико, чтобы загрузить гетерогенную систему на значительное время (более 10 сек). Домножение на коэффициент 1, 2 является поправочным; коэффициент вычислен также эмпирически. Функция ceil(x) в листинге 1 возвращает ближайшее целое к значению х, округленное вверх.

2. Затем осуществляют разбиение задачи в соотношении , причем:

Q Z = T C P U T G P U ,

где TCPU и TGPU - время, затраченное на расчеты центральным и графическим процессором в процессе выполнения вышеописанной процедуры соответственно. В отношении моделирования низкоплотностных кодеков разделить задачу оказывается возможным по точкам значений SNR, так как обычно их симулируется достаточное количество. Разбиение вычислительной задачи осуществляют следующим образом: Вводят вспомогательный коэффициент

Вычисляют общее число точек моделирования:

Вычисляют границы интервалов моделирования:

Здесь SNRinit - минимальное значение сигнал/шум; SNRfinal - максимальное значение сигнал/шум; SNRincr - величина инкремента значения сигнал/шум.

3. После этого осуществляют организацию многопоточных вычислений, где моделирование части точек - Q производят основным потоком на вспомогательном вычислителе (GPU) с синхронизацией хостовой (CPU) частью, а моделирование части точек Ζ осуществляют дополнительным потоком вычислений на CPU. Основной поток (GPU, синхронизируемый CPU) моделирует точки SNR1: SNRinit≤SNR1≤SNRQ.

Дополнительный поток (CPU) моделирует точки SNR2: SNRZ≤SNR2≤SNRfinal.

Достигаемое повышение производительности подтверждается программно полученными данными вычислений, представленными на фиг. 2 в виде графика временного выигрыша, в зависимости от длины кода, при моделировании в гетерогенной системе посредством открытого стандарта реализации техники GPGPU (англ. General-purpose graphics processing units - вычислений общего назначения на графических процессорах) OpenCL (англ. Open Computing Language - открытый язык вычислений) характеристик группы кодов (N, 3, 6) при 10 точках SNR (англ. signal-to-noise ratio - отношение сигнал/шум).

Таким образом, при малых значениях длины (N=96) выигрыш достигает 80% и снижается до 60% при N=204 и 41% при N=273. Затем наблюдается установившийся участок со средним значением выигрыша 21% при длине кода от N=504 до N=3000. Говоря об актуальности и практической важности полученных результатов, упомянутые выше значения длины кода рекомендованы следующими современными техническими стандартами в области телекоммуникаций: 802.11 - WiFi (беспроводные локальные и городские сети, N:648-1944); 802.16 - Mobile WiMAX (местные и городские беспроводные сети, N:576-2304); 802.22 - WRAN (беспроводные региональные сети, N:384-2304).

Область применимости способа ограничены условием Q<Maxsim. Стоит отметить, что принципиально способ реализуем и в гетерогенных системах с многопроцессорным CPU, с учетом полной загрузки всех ядер CPU.

Патенты

1. Патент США «Lithographic simulations using graphical processing units», US 2006/0242618 A1, МПК G06F 17/50, опубл. 26.10.2006.

2. Патент США «Model implementation on GPU», US 7979814 B1, МПК G06F 17/50, опубл. 12.07.2011.

Способ организации вычислений на графических процессорах для моделирования помехоустойчивых низкоплотностных кодеков, заключающийся в том, что хостовой частью выполняют подготовку и передачу данных GPU части (англ. graphics processing unit - графический процессор), после чего запускают основной поток вычислений на GPU, синхронизируемый CPU (англ. central processing unit - центральный процессор), и по завершении моделирования осуществляют передачу результатов вычислений хостовой части, отличающийся тем, что перед запуском вычислений на графическом процессоре производят предварительную оценку значений производительности вычислений на CPU (TCPU) и GPU (TGPU) в отдельности друг от друга, затем разбивают общее число точек моделирования в соотношении Q/Z=TCPU/TGPU, после чего часть точек Q моделируют в основном потоке вычислений на GPU, синхронизируемых с помощью CPU, который одновременно моделирует часть точек Ζ в дополнительном потоке вычислений.



 

Похожие патенты:

Изобретение относится к области геофизики и может быть использовано для определения количества углеводородного флюида, присутствующего в породе углеводородсодержащего пласта.

Изобретение относится к способу бурения нефтяной скважины. Технический результат - повышение эффективности бурения скважины.

Изобретение относится к области геофизики и может быть использовано для определения доверительного значения для плоскости развития трещины. В некоторых аспектах выбирают подмножество микросейсмических событий, связанных с операцией гидроразрыва подземной зоны.

Изобретение относится к области геофизики и может быть использовано для отслеживания трещин в процессе гидроразрыва пласта. Предложенные система, способ и программные средства могут быть использованы для анализа микросейсмических данных от операции по разрыву пласта.

Изобретение относится к области геофизики и может быть использовано для отслеживания трещин в процессе гидроразрыва пласта. Предложенные система, способ и программное обеспечение могут использоваться для анализа микросейсмических данных, обусловленных гидроразрывом.

Изобретение относится к области геофизики и может быть использовано для отслеживания трещин в процессе гидроразрыва пласта. Предложенные система, способ и программное обеспечение могут использоваться для анализа микросейсмических данных из подземной зоны.

Изобретение относится к области геофизики и может быть использовано для прогнозирования операционных результатов операции бурения. По меньшей мере некоторыми из иллюстративных вариантов осуществления являются способы, включающие в себя сбор данных датчиков относительно соседних скважин и контекстных данных относительно соседних скважин и размещение данных датчиков и контекстных данных в хранилище данных, создание сокращенного набора данных посредством идентификации корреляции между данными в хранилище данных и операционным результатом в операции бурения, создание модели на основе сокращенного набора данных и прогнозирование операционного результата на основе модели.

Изобретение относится к области геофизики и может быть использовано для исследований трещин в процессе гидроразрыва пласта. Предложенные система, способ и программное обеспечение применимы для вычисления стратиграфии трещин в подземной области.

Изобретение относится к способу и системе прямого моделирования скважинного изображения свойств пласта. Техническим результатом является повышение эффективности прямого моделирования скважинного изображения свойств пласта.

Изобретение относится к способу проектирования многорежимной интеллектуальной системы (МИС) управления распределенной средой мягких вычислений. Технический результат заключается в повышении эффективности проектирования МИС.

Изобретение относится к области геофизики и может быть использовано для отслеживания трещин в процессе гидроразрыва пласта. Предложены система, способ и носитель данных, используемые для анализа микросейсмических данных, собранных при гидравлическом разрыве пласта в подземной зоне. В некоторых аспектах настоящего изобретения каждую базовую плоскость из множества базовых плоскостей задают по подмножеству микросейсмических данных, причем каждая из них имеет ориентацию относительно общей оси. Кластеры ориентаций базовых плоскостей, предварительно выявленных адаптивно по степени изменчивости ориентаций, можно обновить по новым данным. Затем выявляют число ориентаций, связанных с каждым из кластеров. Технический результат - повышение точности и достоверности информации относительно пространственно геометрических характеристик трещин гидроразрыва пласта. 3 н. и 17 з.п. ф-лы, 9 ил.
Наверх