Способ организации выполнения операции умножения двух чисел в модулярно-логарифмическом формате представления с плавающей точкой на гибридных многоядерных процессорах

Авторы патента:

Князьков Владимир Сергеевич (RU)

Коржавина Анастасия Сергеевна (RU)

G06F7/483 - Способы и устройства для обработки данных с воздействием на порядок их расположения или на содержание обрабатываемых данных (логические схемы H03K 19/00)

G06F17/16 - матричные или векторные вычисления

Владельцы патента RU 2666285:

федеральное государственное бюджетное образовательное учреждение высшего образования "Вятский государственный университет" (ВятГУ) (RU)

Изобретение относится к вычислительной технике и предназначено для выполнения операции умножения двух чисел в модулярно-логарифмическом формате с плавающей точкой. Техническим результатом является упрощение выполнения операции умножения. Способ осуществляется на гибридных многоядерных процессорах и содержит процедуру умножения двух чисел в модулярном формате с плавающей точкой, включая контроль переполнения, потери порядка, масштабирования.

Изобретение относится к вычислительной технике и предназначено для выполнения операции умножения чисел, представленных в модулярно-логарифмическом формате с плавающей точкой на гибридных многоядерных процессорах.

Известен способ организации выполнения операции умножения двух чисел в модулярно-позиционном формате представления с плавающей точкой на универсальных многоядерных процессорах (A.C. RU №2509345, БИ №7, 10.03.2014), в котором операция умножения t-разрядных позиционных мантисс сомножителей заменяется n параллельно выполняемыми операциями умножения q-разрядных знакопозиций чисел в системе счисления в остаточных классах. Недостаток данного способа состоит в том, что не определено, каким образом выявляются ситуации переполнения диапазона представления модулярных мантисс при выполнении операции умножения и выполняется процедура масштабирования мантисс, таким образом, способ (A.C. RU №2509345, БИ №7, 10.03.2014) может быть использован для выполнения операции умножения не для всех операндов из заявленного диапазона представления.

Наиболее близким к заявленному способу является способ организации выполнения операции умножения двух чисел в модулярно-позиционном формате (Исупов К.С., Мальцев А.Н. Способ представления чисел с плавающей точкой большой разрядности, ориентированный на параллельную обработку //Вычислительные методы и программирование: новые вычислительные технологии. 2014. Т. 15, №4. С. 631-643), в котором масштабирование мантиссы осуществляется методом, использующим таблицы поправочных коэффициентов с применением интервально-позиционных характеристик. Недостаток данного способа состоит в том, что необходимо хранить таблицы поправочных коэффициентов большого размера, а также использовать вычислительные устройства с плавающей точкой для вычисления интервальной позиционной характеристики.

Техническим результатом применения способа организации выполнения операции умножения двух чисел в модулярно-логарифмическом формате представления с плавающей точкой на гибридных многоядерных процессорах является оптимизация выполнения операции умножения в раз, где q - разрядность знакопозиций чисел в системе счисления в остаточных классах, за счет использования только целочисленных операций при умножении, проверке выхода за границы диапазона, масштабировании модулярных мантисс степенью двойки, при этом не требуется использования операций с плавающей точкой и подстановочных таблиц. Минимальное время выполнения операции умножения предложенным способом равно минимальному времени выполнения операции умножения способом (A.C. RU №2509345, БИ №7, 10.03.2014), при этом способ может быть применен для умножения любых операндов из заявленного диапазона представления, в чем заключается универсальность предлагаемого способа.

Описание способа организации выполнения операции умножения двух чисел в модулярно-логарифмическом формате представления с плавающей точкой на гибридных многоядерных процессорах: реализация способа осуществляется посредством подачи набора электрических, нейронных либо других сигналов на устройства управления каждого вычислительного ядра многоядерного гибридного процессора, которые, в соответствии с данными сигналами, формируют управляющие команды для операционных устройств соответствующих вычислительных ядер.

В позиционных двоичных форматах с плавающей точкой стандарта IEEE-754 любое вещественное число представляется трехэлементным набором:

где М - рациональная мантисса, е - порядок числа, e_min=2-2^ν-1 и e_m_a_x=2^ν-1-1, S-знак числа.

Величина чисел, записанных в таком формате, выражается формулой -1^S⋅М⋅2^е. Машинными представлениями чисел вида (1) являются (ν+t+1)-разрядные двоичные векторы (Sr_ν-1…r₂r₁d_t…d₂d₁), где разряды с d₁ по d_t отводятся под представление рациональных двоичных мантисс М=d_td_t-1…d₂d₁, разряды с r₁ по r_ν отводятся под представление целочисленных двоичных порядков е, записанных в форме с избытком Е=r_νr_ν-1…r₂r₁=е+e_m_a_x, разряд S выражает знак числа.

Определим целочисленную мантиссу М'=d_td_t-1…d₂d₁ как t-разрядное неотрицательное целое двоичное число, такое, что М=М'⋅2^1-t. Определим перемещенный порядок λ как целое двоичное число со знаком, такое, что λ=е-t+1, где е - ν-разрядный порядок числа, представленного в двоичном формате (1).

Зададим n целочисленных положительных q-разрядных оснований системы остаточных классов p₁,р₂, …, p_n, таких, что ∀i₁, i₂∈{1, 2, …, n), i₁≠i₂: , q≤k, где - наибольший общий делитель для и , k - размер разрядной сетки процессора.

Целочисленную мантиссу М'=d_td_t-1…d₂d₁ преобразуем в систему остаточных классов с заданными основаниями р₁, p₂, …, p_n, получая тем самым модулярную мантиссу :

где m_i∈[0, р_i-1], i=1, 2, …, n - q-разрядные цифры (модулярные разряды) модулярной мантиссы , q - разрядность оснований p₁, p₂, …, p_n, - операция получения остатка от деления М' на i-ое основание p_i.

Определим ранг модулярной мантиссы как значение R, такое, что выполняется условие:

где - мультипликативная инверсия Р_i по модулю рi∈[1, n], n - количество модулей.

R∈[0,n-1] и вычисляется по формуле:

где - наибольшее целое, не превышающее

При условии, что 2^q-1<p_i<2^q, где q - разрядность оснований р₁, р₂, …, р_n, величина может быть вычислена по формуле , где w_i - s-разрядные весовые коэффициенты. Тогда величина ранга может быть вычислена по формуле:

Определим верхнюю и нижнюю границы величины ранга модулярного числа как

, ,

где , , при условии, что 2^q-1<р_i<2^q, - наибольшее целое, не превышающее , s - разрядность коэффициентов w_i.

Согласно теоретико-числовой теореме Эйлера мультипликативную инверсию , соответствующую сравнению , можно вычислить следующим образом

где ϕ(p_i) - функция Эйлера, равная количеству целых чисел в диапазоне [1, р_i], взаимно простых с р_i.

Пример. Вычислим значения мультипликативных инверсий P_i по модулям р_i для системы с основаниями: р₁=11, р₂=13, р₃=15:

; ϕ(11)=10; ;

; ϕ(13)=12; ;

; ϕ(15)=12;

Определим логарифмическую характеристику числа как значение двоичного логарифма от этого числа. Тогда логарифмическая характеристика модуля числа, представленного в формате [М, е, S], вычисляется следующим образом:

log₂(М'⋅2^1-t⋅2^е)=log₂(М')+е-t+1=log₂(М')+λ.

Определим интервальную логарифмическую характеристику мантиссы числа как целочисленный интервал [L_min, L_m_а_х], нижняя и верхняя границы L_min, L_m_а_х которого представлены r-разрядными двоичными числами без знака и вычисляются следующим образом:

L_min=[log₂(М')⋅2^r-h-1],

L_m_а_х=L_min+1

где , - наибольшее целое, не превышающее , [log₂(М')⋅2^r-h-1] - наибольшее целое, не превышающее log₂(М')⋅2^r-h-1.

Диапазон представления нижней и верхней границ L_min, L_m_а_х интервальной логарифмической характеристики:

; ,

где - значение нижней границы интервальной логарифмической характеристики диапазона представления модулярных мантисс , - наибольшее целое, не превышающее .

Таким образом, число с плавающей точкой вида (1) можно преобразовать к следующему модулярно-логарифмическому формату:

где 〈m₁, m₂, …, m_n〉 - набор знакопозиций (модулярных разрядов) модулярной мантиссы , λ- позиционный перемещенный порядок, представляющий собой целое двоичное число со знаком, L_min, L_m_a_x - границы интервальной логарифмической характеристики мантиссы числа, представляющие собой целые двоичные числа без знака, σ - знак числа, причем если σ=-1, то число отрицательное, σ=1 - положительное, σ=0 - машинный ноль.

Диапазон допустимых значений модулярных мантисс в системе остаточных классов с основаниями p₁, p₂, … , р_n определяется интервалом ; таким образом, t-разрядная позиционная мантисса М=d_td_t-1…d₂d₁ может быть представлена в системе остаточных классов набором из n взаимно независимых q-разрядных знакопозиций 〈m₁, m₂, …, m_n〉, причем q≈t/n (при условии, что все основания р₁, p₂, …, p_n q-разрядные).

Примеры преобразования позиционных чисел с плавающей точкой в модулярно-логарифмический формат: пусть числа представлены в 10-разрядном двоичном формате вида (1), в котором под смещенный порядок Е, отводится четыре бита (максимальный порядок е_m_a_x=2^4-1-1=7, соответственно е=Е-7), под дробную часть мантиссы - пять бит (т.е. t=6, причем целая часть d₆ рациональной мантиссы М в явном виде не записана) и под знак числа - один бит.Пусть для представления модулярных мантисс в модулярно-логарифмическом формате [〈m₁, m₂, …, m_n〉, λ, L_min, L_m_a_x, σ] используется три основания: р₁=11, р₂=13, р₃=15. Диапазон представления чисел Р=11⋅13⋅15=2145. Разрядность оснований q=4, разрядность интервальной логарифмической характеристики r=5.

Пример 1: необходимо перевести число X=3.3125₁₀=[1.65625, 1, 0]=-1⁰⋅1.65625⋅2¹, представленное в двоичном формате [М, е, S], в модулярно-логарифмический формат [〈m₁, m₂, …, m_n〉, L_min, L_m_a_x, λ, σ].

С учетом принятых характеристик двоичного формата [М, е, S], число X будет записано в памяти ЭВМ в виде двоичного вектора 〈0100010101〉. Для его преобразования в модулярно-логарифмический формат (2) необходимо выполнить следующие действия:

1. Выделить составные части числа X: знак числа S=0, дробная часть рациональной мантиссы d₅…d₂d₁=10101₂, смещенный (избыточный) порядок Е=1000₂=8.

2. Восстановить целую часть d₆ мантиссы М=d₆d₅…d₂d₁:d₆=1, т.к. Е>0, следовательно, М=1.10101₂.

3. Определить порядок е: е=Е-е_m_a_x=8-7=1, т.к. Е>0.

4. Определить знак σ, перемещенный позиционный порядок λ и целочисленную мантиссу М': σ=1, λ=е-t+1=1-6+1=-4, М'=d₆d₅…d₂d₁=110101₂=53.

5. Найти модулярную мантиссу : .

6. Вычислить интервально-логарифмическую характеристику мантиссы L_min, L_mах: L_min=[log₂(53)⋅2^5-3-1]=11, L_m_a_x=11+1=12.

В результате получается число X, представленное в модулярно-логарифмическом формате с плавающей точкой: X=[〈9, 1, 8〉, 11, 12, -4, 1].

Пример 2: необходимо перевести число X=0.02783203125₁₀=[1.78125, -5, 1]=-1¹⋅1.78125⋅2^-5 из двоичного формата [М, е, S] в модулярно-логарифмический формат [〈m₁, m₂, …, m_n〉, L_min, L_m_a_x, λ, σ].

С учетом принятых характеристик двоичного формата [М, е, S], число X будет записано в памяти ЭВМ в виде двоичного вектора 〈1000111001〉. Для его преобразования в модулярно-логарифмический формат (2) необходимо выполнить следующие действия:

1. Выделить составные части числа X: знак числа S=1, дробная часть d₅…d₂d₁=11000₂, смещенный порядок Е=0001₂=1.

2. Восстановить целую часть d₆ мантиссы М=d₆d₅…d₂d₁:d₆=1, т.к. Е>0, следовательно, М=1.11001₂.

3. Определить порядок е. е=е_min=1-7=-6, т.к. Е=0.

4. Определить знак σ, перемещенный порядок λ и целочисленную мантиссу М': σ=-1, λ=e-t+l=-6-6+1=-11, М'=d₆d₅…d₂d₁=111001₂=57.

5. Найти модулярную мантиссу :

6. Вычислить интервально-логарифмическую характеристику мантиссы L_min, L_m_a_x: L_min=log₂(57)⋅2^5-3-1]=11, L_m_a_x=11+1=12.

В результате получается число X, представленное в модулярно-логарифмическом формате с плавающей точкой: X=[〈2, 5, 12〉, 11, 12, -11, -1].

Алгоритм 1. Вычисление ранга числа, представленного в модулярно-логарифмическом формате.

Пусть - число, представленное в модулярно-логарифмическом формате с плавающей точкой, где - модулярная мантисса числа А. Для того чтобы найти ранг R модулярной мантиссы , необходимо:

1. Вычислить значение минимальной величины ранга R_min модулярной мантиссы : , где , , мультипликативная инверсия Р_i по модулю р_i, , - наибольшее целое, не превышающее , - наибольшее целое, не превышающее , s - разрядность , при условии, что 2^q-1<рi<2^q, s>1+log₂n.

2. Вычислить значение максимальной величины ранга R_m_a_x модулярной мантиссы : где , - мультипликативная инверсия Р_i по модулю р_i, , - наибольшее целое, не превышающее , - наибольшее целое, не превышающее , s - разрядность , при условии, что 2^q-1<рi<2^q, s>1+log₂n.

3. Если R_min=R_m_a_x, то R=R_min, иначе выполнить сравнение: если , то есть значение мантиссы меньше половины максимально возможного значения, то R=R_m_a_x, если , то есть значение мантиссы больше или равно половине максимально возможного значения, то R=R_min, где L_Р/2=L_Р-2^r-h-1, , , r - разрядность интервальной логарифмической характеристики числа .

Пример: необходимо вычислить ранги чисел A=53 и B=57. Используется три основания: р₁=11, р₂=13, р₃=15. Р=р₁⋅р₂⋅р₃=2145 - произведение оснований (верхний предел допустимого диапазона представления модулярных мантисс). , , , , , . Разрядность оснований q=4. Разрядность коэффициентов w_i:s=5.

Значения верхних и нижних границ , коэффициентов для значений модулей р₁=11, р₂=13, р₃=15 равны соответственно , , , , , .

Значения мультипликативных инверсий для модулей р₁=11, р₂=13, р₃=15 равны соответственно , , .

Вычислим значение ранга первого числа.

1. Вычислим значение минимальной величины ранга R_min модулярной мантиссы:

2. Вычислим значение максимальной величины ранга R_m_a_x модулярной мантиссы:

3. Так как R_min=R_m_a_x, то R^A=R_min=1. Вычислим значение ранга второго числа.

Вычислим значение ранга второго числа.

1. Вычислим значение минимальной величины ранга R_min модулярной мантиссы:

2. Вычислим значение максимальной величины ранга R_m_a_x модулярной мантиссы:

3. Так как R_min=R_m_a_x, то R^B=R_min=1.

Алгоритм 2. Деление модулярной мантиссы числа, представленного в модулярно-логарифмическом формате, на число 2^x (масштабирование степенью двойки).

Пусть - число, представленное в модулярно-логарифмическом формате с плавающей точкой, где - модулярная мантисса числа А. Для того чтобы найти результат деления модулярного числа на позиционное число 2^x, необходимо:

1. Вычислить α. Если x>q-1, то вычислить значение , где - наименьшее целое, не превышающее , α=|х|_q-1; если x≤q-1, то α=х.

2. Вычислить значение ранга R для модулярного числа в соответствии с алгоритмом 1.

3. Вычислить остаток от деления модулярного числа на р_n+1=2^q-1:

где , , - мультипликативная инверсия Р_i по модулю р_i.

Если 0<α<q-1, то , если α=0, то уменьшить j на 1.

4. Вычислить значение , для чего вычесть из каждого значения знакопозиций модулярного числа значение остатка от деления на 2^α

5. Вычислить значение , для чего умножить каждое значение знакопозиций модулярного числа на мультипликативные инверсии 2^α по соответствующим модулям.

где - мультипликативная инверсия числа 2^α по модулю р_i - результат сравнения .

6. Если , то прибавить к величину .

7. Шаги 2-6 выполнить j раз для α=q-1.

Пример. Необходимо разделить числа А=53 и В=57 на число 2¹. Используется три основания: р₁=11, р₂=13, р₃=15. Р=р₁⋅р₂⋅р₃=2145 - произведение оснований (верхний предел допустимого диапазона представления модулярных мантисс), , . Разрядность оснований q=4.

Значения мультипликативных инверсий для модулей р₁=11, р₂=13, р₃=15 равны соответственно , , .

Значения мультипликативных инверсий по модулям р₁=11, р₂=13, р₃=15 и для значений α=1, 2, 3 равны соответственно ; ; ; ; ; ; ; .

Значения остатков от деления и на 2^α для значений модулей р₁=11, р₂=13, р₃=15 и для значений α=1, 2, 3 равны соответственно

; ; ;

Вычисляем значение .

1. α=x=1, так как x=1<q=4-1.

2. Вычисляем ранг числа A=53 соответствии с алгоритмом 1. R^A=1.

3. Вычисляем остаток от деления модулярного числа на 2^4-1=8:

Вычисляем остаток от деления модулярного числа на р₄=2¹ .

4. Вычитаем из модулярного числа модулярное значение остатка от деления на 2 :

5. Умножаем на мультипликативные инверсии двойки по соответствующим модулям:

6. Прибавляем квеличину 1=(1, 1, 1), так как :

Вычисляем значение

1. α=х=1, так как х=1<q=4-1.

2. Вычисляем ранг числа В=57 соответствии с алгоритмом 1. R^B=1.

3. Вычисляем остаток от деления модулярного числа на 2^4-1=8:

Вычисляем остаток от деления модулярного числа на р₄=2¹

4. Вычитаем из модулярного числа модулярное значение остатка от деления на 2 :

5. Умножаем на мультипликативные инверсии двойки по соответствующим модулям:

6. Прибавляем к величину 1=(1, 1, 1), так как :

Алгоритм 3. Выполнение операции умножения с плавающей точкой в модулярно-логарифмическом формате. Для того чтобы найти произведение чисел и , представленных в модулярно-логарифмическом формате с плавающей точкой, необходимо:

1. Проверить результат на равенство 0. Если σ^С=σ^А⋅σ^В=0, что означает равенство нулю одного из операндов или обоих операндов сразу, то

Если оба операнда ненулевые, то перейти к следующему шагу.

2. Присвоить знак произведению σ^С=σ^А⋅σ^В. Определить верхнюю и нижнюю границы интервальной логарифмической характеристики результата , . Определить порядок результата λ^С=λ^А+λ^В.

3. Проверить выход результата за границы диапазона представления чисел. Если , то

. Если ,то. Если и , то перейти к следующему шагу.

4. Проверить выход мантиссы результата за границы диапазона представления модулярных мантисс и выполнить умножение модулярных мантисс.

4.1. Если , то выполнить коррекцию операндов следующим образом:

4.1.1. Вычислить значения поправочных коэффициентов L₁ и L₂: , , где - наибольшее целое, не превышающее , - наибольшее целое, не превышающее

Если |L₁|≤|L₂| и L₂≥0, то z_А=L₁, z_В=0.

Если |L₁|≤|L₂| и L₂<0, то z_А=0, z_В=L₁.

Если |L₁|>|L₂|и |L₁+L₂|₂=1, то , .

Если |L₁|>|L₂|и |L₁+L₂|₂=0, то., .

4.1.2. Вычислить значения скорректированных мантисс и операндов и скорректировать значение верхней и нижней границы интервальной логарифмической характеристики результата.

Если и I, то , .

Если и , то , , если , то .

Если и, то, , если , то .

Если и , то , если , то .

Если и , то , , если , то , иначе .

Если и , то , , если то если , то .

Если и , то , , если , то , если , то .

Если и , то , , если , то , иначе .

4.1.3. Скорректировать значение порядка результата λ^C=λ^C+L₁.

4.1.4. Скорректировать значение верхней и нижней границы интервальной логарифмической характеристики результата если , то , иначе ;

4.2. Выполнить умножение модулярных мантисс путем нахождения значений , где - наибольшее целое, не превышающее

4.3. Если и , то выполнить коррекцию результата следующим образом.

4.3.1. Вычислить значение поправочного коэффициента .

4.3.2. Вычислить значение скорректированной мантиссы результата: .

4.3.3. Вычислить значение порядка результата λ^C=λ^C-z_C.

4.3.4. Выполнить коррекцию значений верхней и нижней границы интервальной логарифмической характеристики результата , .

4.4. Если и , то выполнить коррекцию результата следующим образом:

4.4.1. Вычислить значение поправочного коэффициента .

4.4.2. Вычислить значение скорректированной мантиссы результата и скорректировать значение верхней и нижней границы интервальной логарифмической характеристики результата.

Если , то.

Если , то , если , то .

Если то если , то .

4.4.3. Вычислить значение порядка результата λ^С=λ^С+z_С.

4.4.4. Выполнить коррекцию значений верхней и нижней границы интервальной логарифмической характеристики результата ; .

В результате выполнения данных операций получается произведение чисел и , представленное в модулярно-логарифмическом формате с плавающей точкой.

Пусть - числа, представленные в модулярно-логарифмическом формате с плавающей точкой, где и - модулярные мантиссы чисел А и В соответственно. Тогда способ умножения С=А⋅В чисел А и В, представленных в модулярно-логарифмическом формате с плавающей точкой (2), на гибридном многоядерном процессоре, содержащем n q-разрядных модулярных вычислительных ядер, одно k-разрядное и два r-разрядных универсальных целочисленных ядра, два специализированных s-разрядных векторных ядра, одно специализированное q-разрядное векторное ядро, одно специализированное управляющее ядро, определяется следующим образом.

1. Множитель и множимое , представленные в модулярно-логарифмическом формате с плавающей точкой, загружают в гибридный многоядерный процессор, содержащий n q-разрядных модулярных вычислительных ядер, одно k-разрядное и два r-разрядных универсальных целочисленных ядра, два специализированных s-разрядных векторных ядра, одно специализированное q-разрядное векторное ядро, одно специализированное управляющее ядро, следующим образом:

- в первое модулярное ядро гибридного многоядерного процессора загружают разрядные двоичные представления первых знакопозиций и модулярных мантисс и чисел А и В соответственно, а также основание системы остаточных классов р₁ и значение мультипликативной инверсии Р₁ по модулю р₁ ;

- параллельно с этим во второе модулярное ядро гибридного многоядерного процессора загружают q-разрядные двоичные представления вторых знакопозиций и модулярных мантисс и чисел А и В соответственно, а также основание системы остаточных классов р₂ и значение мультипликативной инверсии Р₂ по модулю р₂ ;

- и т.д.;

- параллельно с этим в n-ое модулярное ядро гибридного многоядерного процессора загружают q-разрядные двоичные представления n-ых знакопозиций и модулярных мантисс и чисел А и В соответственно, а также основание системы остаточных классов р_n и значение мультипликативной инверсии Р_n по модулю р_n ;

- параллельно с этим в первое универсальное вычислительное ядро загружают k-разрядные двоичные порядки λ^А и λ^В, а также знаки σ^А и σ^В чисел А и В соответственно;

- параллельно с этим во второе универсальное вычислительное ядро загружают r-разрядные значения нижних границ интервальных логарифмических характеристик и чисел А и В соответственно;

- параллельно с этим в третье универсальное вычислительное ядро загружают r-разрядные значения верхних границ интервальных логарифмических характеристик и чисел А я В соответственно, а также r-разрядное значение нижней границы интервальной логарифмической характеристики диапазона представления модулярных мантисс L_р;

- параллельно с этим в первое векторное вычислительное ядро загружают вектор s-разрядных констант коэффициентов ;

- параллельно с этим во второе векторное вычислительное ядро загружают вектор s-разрядных констант коэффициентов ;

- параллельно с этим в третье векторное вычислительное ядро загружают вектор разрядных констант остатков от деления ;

- параллельно с этим в управляющее ядро загружают k-разрядные двоичные порядки λ^А и λ^В, r-разрядные значения нижних границ интервальных логарифмических характеристик и и r-разрядные значения верхних границ интервальных логарифмических характеристик и чисел А и В соответственно, а также r-разрядное значение нижней границы интервальной логарифмической характеристики диапазона представления модулярных мантисс L_р.

2. После того, как множитель и множимое представленные в модулярно-логарифмическом формате с плавающей точкой, загружены в гибридный процессор, содержащий n q-разрядных модулярных вычислительных ядер, одно k-разрядное и два r-разрядных универсальных целочисленных ядра, два специализированных s-разрядных векторных ядра, одно специализированное q-разрядное векторное ядро, одно специализированное управляющее ядро, операция их умножения выполняется следующим образом:

- в первом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₁ q-разрядных двоичных представлений знакопозиций и модулярных мантисс и чисел А и В соответственно, путем нахождения значения , где - наибольшее целое, не превышающее ; все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

-параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₂ q-разрядных двоичных представлений знакопозиций и модулярных мантисс и чисел А и В соответственно; все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

- и т.д.

- параллельно с этим в -ом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р_n q-разрядных двоичных представлений знакопозиций и модулярных мантисс и чисел А и В соответственно; все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

- параллельно с этим в первом универсальном вычислительном ядре процессора выполняется сложение λ^C=λ^А+λ^В двоичных порядков λ^А и λ^В, а также умножение σ^С=σ^А⋅σ^В знаков σ^А и σ^В чисел А и В соответственно;

- параллельно с этим во втором универсальном вычислительном ядре процессора выполняется сложение двоичных значений нижних границ интервальных логарифмических характеристик и чисел А и В соответственно;

- параллельно с этим в третьем универсальном вычислительном ядре процессора выполняется сложение двоичных значений верхних границ интервальных логарифмических характеристик и чисел А и В соответственно;

- параллельно с этим в управляющем ядре вычисляются следующие значения поправочных коэффициентов: , , , , , z_А=L₁+1, z_В=0, если |L₁|≤|L₂| и L₂≥0, z_А=0, z_В=L₁+1, если |L₁|≤|L₂| и L₂<0, , , если |L₁|>|L₂| и |L₁+L₂|₂=1, , , если |L₁|>|L₂| и |L₁+L₂|₂=0.

3. После того, как получено промежуточное значение произведения чисел и , выполняется коррекция результата следующим образом:

3.1. Если знак промежуточного результатапроизведения чисел А и Вне равен 0, и порядок промежуточного результата произведения чисел А и В принадлежит интервалу [2-2^k-1; 2^k-1-2], и значение верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В меньше значения нижней границы интервальной логарифмической характеристики максимально возможного значения мантиссы, то есть , , , то коррекции результата не требуется.

3.2. Если знак промежуточного результата произведения чисел А и В равен 0, то есть, то:

- в первом универсальном вычислительном ядре процессора выполняется обнуление двоичного порядка промежуточного результата произведения чисел А и В;

- параллельно с этим во втором универсальном вычислительном ядре процессора выполняется обнуление двоичного значения нижней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В;

- параллельно с этим в третьем универсальном вычислительном ядре процессора выполняется обнуление двоичного значения верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В.

3.3. Если знак промежуточного результата произведения чисел А и В не равен 0 и значение , то есть модуль промежуточного результата произведения чисел А и В выходит за границы минимально возможного представления, то:

- в первом универсальном вычислительном ядре процессора выполняется обнуление двоичного порядка и знака промежуточного результата произведения чисел А и В;

- параллельно с этим в первом модулярном вычислительном ядре процессора выполняется обнуление значения первой знакопозиций промежуточного результата произведения чисел А и В;

-параллельно с этим во втором модулярном вычислительном ядре процессора выполняется обнуление значения второй знакопозиций промежуточного результата произведения чисел А и В;

- и т.д.

- параллельно с этим в n-ом модулярном вычислительном ядре процессора выполняется обнуление значения n-ой знакопозиций промежуточного результата произведения чисел А и В.

3.4. Если знак промежуточного результата произведения чисел А и В не равен 0 и значение , то есть модуль промежуточного результата произведения чисел А и В выходит за границы максимального возможного представления, то:

- в первом универсальном вычислительном ядре процессора выполняется присвоение двоичному порядку промежуточного результата произведения числе А и В;

- параллельно с этим в первом модулярном вычислительном ядре процессора выполняется обнуление значения первой знакопозиции промежуточного результата произведения чисел А и В;

- параллельно с этим во втором модулярном вычислительном ядре процессора выполняется обнуление значения второй знакопозиции промежуточного результата произведения чисел А и В;

- и т.д.

- параллеьно с этим в n-ом модулярном вычислительном ядре процессора выполняется обнуление значения n-ой знакопозиции промежуточного результта произведения чисел А и В.

3.5. Знак промежутоного результата произведения чисел А и В не равен 0, и порядок промежуточного результата умножения чисел А и В принадлежит интервалу , где - наибольшее целое, не превышающее , и значение верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В меньше значения нижней границы интервальной логарифмической характеристики максимально возможного значения мантиссы , то управляющее ядро передает во все модулярные и все универсальные целочисленные ядра значения поправочных коэффициентов: , , где - наибольшее целое, не превышающее , после чего:

- в первом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы ) промежуточного результата произведения чисел А и В и значения следующим образом: выполняется операция целочисленного умножения по модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы промежуточного результата произведения чисел А и В и значения , полученного сдвигом числа 1 на двоичных разрядов влево, путем нахождения значения , где - наибольшее целое, не превышающее ; затем, если , то раз выполняется операция целочисленного умножения по модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы промежуточного результата произведения чисел А и В и значения 2^q-1, полученного сдвигом числа 1 на (q-1) двоичных разрядов влево, путем нахождения значения , где - наибольшее целое, не превышающее ; все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

- параллельно с этим во втором модулярном вычислительном ядре процессора

выполняется операция целочисленного умножения по модулю р₂ q-разрядного двоичного представления знакопозиций модулярной мантиссы промежуточного результата произведения чисел А и В и значения следующим образом: выполняется операция целочисленного умножения по модулю р₂; затем, если , то раз выполняется операция целочисленного умножения по модулю р₂;

- и т.д.

- параллельно с этим в -ом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р_n q-разрядного двоичного представления знакопозиций модулярной мантиссы промежуточного результата произведения чисел А и В и значения следующим образом: выполняется операция целочисленного умножения по модулю р_n; затем, если , то раз выполняется операция целочисленного умножения по модулю р_n;

- параллельно с этим в первом универсальном вычислительном ядре процессора выполняется коррекция двоичного порядка промежуточного результата произведения чисел А и В;

- параллельно с этим во втором универсальном вычислительном ядре процессора выполняется коррекция двоичного значения нижней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В;

- параллельно с этим в третьем универсальном вычислительном ядре процессора выполняется коррекциядвоичного значения верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В.

3.6. Если знакпромежуточного результатапроизведения чисел А и В не равен 0, и порядок промежуточного результата произведения чисел А и В принадлежит интервалу , где - наибольшее целое, не превышающее , и значение верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В меньше значения нижней границы интервальной логарифмической характеристики максимально возможного значения мантиссы , то управляющее ядро передает во все модулярные и все универсальные целочисленные ядра значение поправочного коэффициента , после чего:

3.6.1. Выполняется загрузка мультипликативных инверсий и 2^q-1:

- в первое модулярное ядро загружают ^-разрядные двоичные значенияи , мультипликативных инверсий и 2^q-1 по модулю р₁;

- параллельно с этим во второе модулярное ядро загружают q-разрядные двоичные значения и мультипликативных инверсий и 2^q-1 по модулю р₂;

- и т.д.;

- параллельно с этим в n-ое модулярное ядро загружают q-разрядные двоичные значения и мультипликативных инверсий и 2_q-1 по модулю р_n;

- параллельно с этим в управляющем ядре вычисляется количество итераций j: j=0, если , , если , где - наибольшее целое, не превышающее .

3.6.2. Если , то действия 3.6.3-3.6.7 выполняются один раз для , затем если количество итераций j≥1, то действия 3.6.3-3.6.7 выполняются j раз для α=q-1.

3.6.3. Вычисляются значения элементов вектора :

- в первом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы промежуточного результатапроизведения чисел А и В и значения мультипликативной инверсии Р₁ по модулю р₁ , путем нахождения значения где - наибольшее целое, не превышающее ; все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

- параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₂ q-разрядного двоичного представления знакопозиций модулярной мантиссы промежуточного результата произведения чисел А и В и значения мультипликативной инверсии Р₂ по модулю р₂ ;

- и т.д.

- параллельно с этим в -ом модулярном вычислительном ядре процессора выполняется операция целочисленного умноженияпо модулю р_n q-разрядного двоичного представления знакопозиций модулярной мантиссы промежуточного результата произведения чисел А и В и значения мультипликативной инверсии Р_n по модулю р_n .

3.6.4. После того, как получены значения элементов вектора , данный вектор загружается в векторные ядра следующим образом:

- в первое векторное вычислительное ядро загружают вектор q-разрядных элементов , q≤s;

- параллельно с этим во второе векторное вычислительное ядро загружают вектор q-разрядных элементов , q≤s;

- параллельно с этим в третье векторное вычислительное ядро загружают вектор q-разрядных элементов;

3.6.5. После того, как элементы вектора загружены в векторные ядра, производится вычисление ранга и частичного остатка от деления на 2^q-1 модулярной мантиссы промежуточного результата произведения чисел А я В:

-в первом векторном вычислительном ядре вычисляют скалярное произведение векторов и , вычисляют значение , где - наибольшее целое, не превышающее значение передается в управляющее ядро;

- параллельно с этим во втором векторном вычислительном ядре вычисляют скалярное произведение векторов и вычисляют значение , где - наибольшее целое, не превышающее , значение передается в управляющее ядро;

- параллельно с этим в третьем векторном вычислительном ядре вычисляют скалярное произведение векторов и , значение передается в управляющее ядро.

3.6.6. После того, как результаты скалярного произведения векторов переданы в управляющее ядро, в управляющем ядре вычисляется значение ранга , если или , R=R_max, если , и значение остатка от деления модулярной мантиссы промежуточного результата произведения чисел А и В .

3.6.7. После того, как управляющее ядро передаст во все модулярные и все универсальные целочисленные ядра значения и α, выполняется деление модулярной мантиссы промежуточного результатапроизведения чисел А и В на число 2α:

- в первом модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы промежуточного результата произведения чисел А и В и значения следующим образом: если , то , если, то; после чего выполняется операция умножения по модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы промежуточного результатапроизведения чисел А и В и значения мультипликативной инверсии 2_α по модулю р₁ путем нахождения значения , где - наибольшее целое, не превышающее ; после чего если выполняется операция сложения по модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы промежуточного результата произведения чисел А и В следующим образом: если , то если , то; все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

- параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р₂ q-разрядного двоичного представления знакопозиций модулярной мантиссы промежуточного результатапроизведения чисел А и В и значения , после чего выполняется операция умножения по модулю р₂ q-разрядного двоичного представления знакопозиций и значения мультипликативной инверсии 2α по модулю р₂ ; после чего если выполняется операция сложения по модулю р₂;

- и т.д.

- параллельно с этим в -ом модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р_n q-разрядного двоичного представления знакопозиций модулярной мантиссы промежуточного результата произведения чисел А и В и значения ; после чего выполняется операция умножения по модулю р_n q-разрядного двоичного представления знакопозиций и значения мультипликативной инверсии 2^α по модулю р_n ; после чего если выполняется операция сложения по модулю р_1n;

- параллельно с этим во втором универсальном вычислительном ядре процессора выполняется коррекция если , иначе двоичного значения нижней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В;

- параллельно с этим в третьем универсальном вычислительном ядре процессора выполняется коррекция , если иначе двоичного значения верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В;

3.7. Если знак промежуточного результата произведения чисел А и В не равен 0, и значение верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В больше или равно значению нижней границы интервальной логарифмической характеристики максимально возможного значения мантиссы , то управляющее ядро передает во все модулярные и все универсальные целочисленные ядра значение поправочных коэффициентов z_А, z_В, после чего:

3.7.1. Выполняется загрузка мультипликативных инверсий , и 2^q-1:

- в первое модулярное ядро загружают q-разрядные двоичные значения , и мультипликативных инверсий , и 2^q-1 по модулю р₁;

- параллельно с этим во второе модулярное ядро загружают q-разрядные двоичные значения , и мультипликативных инверсий , и 2^q-1 по модулю р₂;

- и т.д.;

- параллельно с этим в и-ое модулярное ядро загружают q-разрядные двоичные значения,имультипликативных инверсий , и 2^q-1 по модулю р_n;

- параллельно с этим в управляющем ядре вычисляется количество итераций j_А=0, если z_А<q-1, , если z_А>q-1 и j_В=0, если z_В<q-1, , если z_В>q-1.

3.7.2. Если |Z_A|_q-1>0, то действия 3.7.3-3.7.7 выполняются один раз для затем если количество итераций j_А≥1, то действия 3.7.3-3.7.7 выполняются j_А раз для α=q-1.

3.7.3. Вычисляются значения элементов вектора :

- в первом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы числа А и значения мультипликативной инверсии Р₁ по модулю р₁ , путем нахождения значения , где - наибольшее целое, не превышающее; все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

- параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₂ q-разрядного двоичного представления знакопозиций модулярной мантиссы и значения мультипликативной инверсии Р₂ по модулю р₂ ;

- и т.д.

3.7.4. После того, как получены значения элементов вектора , данный вектор загружается в векторные ядра следующим образом:

- в первое векторное вычислительное ядро загружают вектор q-разрядных элементов , q≤s;

- параллельно с этим во второе векторное вычислительное ядро загружают вектор q-разрядных элементов , q≤s;

- параллельно с этим в третье векторное вычислительное ядро загружают вектор q-разрядных элементов .

3.7.5. После того, как элементы вектора загружены в векторные ядра, производится вычисление ранга и частичного остатка от деления на 2^q-1 модулярной мантиссы числа А следующим образом:

- в первом векторном вычислительном ядре вычисляют скалярное произведение векторов и , вычисляют значение , где - наибольшее целое, на превышающее , значение передается в управляющее ядро;

- параллельно с этим во втором векторном вычислительном ядре вычисляют скалярное произведение векторов и , вычисляют значение , где - наибольшее целое, не превышающее, значение передается в управляющее ядро;

3.7.6. После того, как результаты скалярного произведения векторов переданы в управляющее ядро, в управляющем ядре вычисляется значение ранга , если или, R=R_m_а_х, если и значение остатка от деления модулярной мантиссы числа А на 2^α: .

3.7.7. После того, как управляющее ядро передаст во все модулярные и все универсальные целочисленные ядра значения и α, выполняется деление модулярной мантиссы числа А на число 2^α:

- в первом модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы числа А и значения следующим образом: если , то , если, то ; после чего выполняется операция умножения по модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы числа А и значения мультипликативной инверсии 2^α по модулю р₁ путем нахождения значения , где - наибольшее целое, не превышающее ; после чего если выполняется операция сложенияпо модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы числа А следующим образом: если , то если , то ; все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

- параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р₂ q-разрядного двоичного представления знакопозиций модулярной мантиссы числа А и значения , после чего выполняется операция умножения по модулю р₂ q-разрядного двоичного представления знакопозиций и значения мультипликативной инверсии 2_α по модулю р₂ ; после чего если выполняется операция сложения по модулю р₂;

- и т.д.

- параллельно с этим в -ом модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р_n q-разрядного двоичного представления знакопозиций модулярной мантиссы числа А и значения ; после чего выполняется операция умножения по модулю р_n q-разрядного двоичного представления знакопозиций и значения мультипликативной инверсии 2^α по модулю р_n ; после чего если выполняется операция сложения по модулю р_n;

- параллельно с этим во втором универсальном вычислительном ядре процессора выполняется коррекция , если , иначе двоичного значения нижней границы интервальной логарифмической характеристикипромежуточного результатапроизведения чисел А и В;

- параллельно с этим в третьем универсальном вычислительном ядре процессора выполняется коррекция , если , иначе двоичного значения верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В;

3.7.8. Если |z_B|_q-1>0, то действия 3.7.9-3.7.13 выполняются один раз для α=|z_B|_q-1; затем если количество итераций j_В≥1, то действия 3.7.9-3.7.13 выполняются затем j_В раз для α=q-1.

3.7.9. Вычисляются значения элементов вектора :

- в первом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы числа В и значения мультипликативной инверсии Р₁ по модулю р₁ , путем нахождения значения , где - наибольшее целое, не превышающее ; все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

- параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₂ q-разрядного двоичного представления знакопозиций модулярной мантиссы и значения мультипликативной инверсии Р₂ по модулю р₂ ;

- и т.д.

3.7.10. После того, как получены значения элементов вектора , данный вектор загружается в векторные ядра следующим образом:

- в первое векторное вычислительное ядро загружают вектор q-разрядных элементов ;

- параллельно с этим во второе векторное вычислительное ядро загружают вектор q-разрядных элементов ;

- параллельно с этим в третье векторное вычислительное ядро загружают вектор q-разрядных элементов

3.7.11. После того, как элементы вектора загружены в векторные ядра, производится вычисление ранга и остатка от деления на 2^q-1 следующим образом:

- в первом векторном вычислительном ядре вычисляют скалярное произведение векторов и значение передается в управляющее ядро;

- параллельно с этим во втором векторном вычислительном ядре вычисляют скалярное произведение векторов и , значение передается в управляющее ядро;

- параллельно с этим в третьем векторном вычислительном ядре вычисляют скалярное произведение векторов и , значение передается в управляющее ядро;

3.7.12. После того, как результаты скалярного произведения векторов переданы в управляющее ядро, в управляющем ядре вычисляется значение ранга , если или , , если и значение остатка от деления модулярной мантиссы числа В на 2^α: .

3.7.13. После того, как управляющее ядро передаст во все модулярные и все универсальные целочисленные ядра значения и α, выполняется деление модулярной мантиссы числа В на число 2^α:

- в первом модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы числа В и значения следующим образом: если , то , если , то , после чего выполняется операция умножения по модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы числа В и значения мультипликативной инверсии 2^α по модулю р₁ путем нахождения значения , где - наибольшее целое, не превышающее; после чего если , выполняется операция сложения по модулю р₁ q-разрядного двоичного представления знакопозиций модулярной мантиссы числа В следующим образом: если, то, если то ; все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

- параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р₂ q-разрядного двоичного представления знакопозиций модулярной мантиссы числа В и значения , после чего выполняется операция умножения по модулю р₂ q-разрядного двоичного представления знакопозицийи значения мультипликативной инверсии 2^α по модулю p₂ ; после чего, если, выполняется операция сложения по модулю р₂;

- и т.д.

-параллельно с этим в -ом модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р_n q-разрядного двоичного представления знакопозиций модулярной мантиссы числа В и значения ; после чего выполняется операция умножения по модулю р_n q-разрядного двоичного представления знакопозиций и значения мультипликативной инверсии 2^α по модулю р_n после чего, если выполняется операция сложения по модулю р_n;

- параллельно с этим во втором универсальном вычислительном ядре процессора выполняется коррекция , если , иначе двоичного значения нижней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В;

- параллельно с этим в третьем универсальном вычислительном ядре процессора выполняется коррекция , если, иначе двоичного значения верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В;

3.7.14. После того, как выполнена коррекция мантисс и чисел А и В соответственно, выполняется их умножение следующим образом:

- параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция целочисленного умноженияпо модулю р₂ q-разрядных двоичных представлений знакопозиций и модулярных мантисс и чисел А и В соответственно; все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

- и т.д.

Для выполнения операции сложения двух целых q-разрядных двоичных чисел требуется устройство, состоящее из q элементарных двоичных устройств, для выполнения операции умножения двух целых q-разрядных двоичных чисел требуется устройство, состоящее из q×q элементарных двоичных устройств, для выполнения операции модулярного умножения двух целых q-разрядных двоичных чисел требуется устройство, состоящее из 2×q×q элементарных двоичных устройств, для хранения одного бита информации требуется устройство, состоящее из одного элементарного двоичного устройства, для сложения двух q-разрядных двоичных чисел в формате с плавающей точкой с направленным округлением требуется устройство, состоящее из 2×q элементарных двоичных устройств. Для выполнения операции умножения способом (A.C. RU №2509345, БИ №7, 10.03.2014) требуется устройство, состоящее из (2×k×k×n+k) элементарных двоичных устройств, где k - разрядность одного ядра универсального многоядерного процессора, n - количество модулей. Для выполнения операции умножения способом (К.С. Исупов, А.Н. Мальцев. «Способ представления чисел с плавающей точкой большой разрядности, ориентированный на параллельную обработку», Вычислительные методы и программирование, 15:4 (2014), с. 631-643.), требуется устройство, состоящее из (2^β-l)×n×q+2×q×q×n+k+2×2×γ, где β - шаг масштабирования, n - количество моделей, q - разрядность модулей, k - разрядность порядка, γ - разрядность интервальной позиционной характеристики). Для выполнения операции умножения предложенным способом, требуется устройство, состоящее из 2×q×q×n+k+2×r+2×(n×s×s+(n-1)×(s+log₂n))+(n×q×q+(n-1)×q), где n - количество моделей, q - разрядность модулей, k -разрядность порядка, r - разрядность интервальной логарифмической характеристики, s -разрядность весовых коэффициентов. При условии, что k=r=s=q, β=q-1, γ=2⋅q, для выполнения операции умножения способом (A.C. RU №2509345, БИ №7, 10.03.2014) требуется устройство, состоящее из (q⋅(2⋅n⋅q+1)) элементарных двоичных устройств, для выполнения операции умножения способом (К.С. Исупов, А.Н. Мальцев. «Способ представления чисел с плавающей точкой большой разрядности, ориентированный на параллельную обработку», Вычислительные методы и программирование, 15:4 (2014), с. 631-643.), требуется устройство, состоящее из (q⋅((2^q-1-1)⋅n+2⋅q+9)), для выполнения операции умножения предложенным способом, требуется устройство, состоящее из (5⋅n⋅q²+3⋅n⋅q+(n-1)⋅log₂n).

Предложенный способ полностью описывает процедуру умножения двух чисел в модулярном формате с плавающей точкой, включая контроль переполнения, потери порядка, масштабирования, при этом требует для своего выполнения устройство всего в раза сложнее, чем требуется для выполнения способа (A.C. RU №2509345, БИ №7, 10.03.2014) и в раз проще, чем требуется для способа (Исупов К.С., Мальцев А.Н. Способ представления чисел с плавающей точкой большой разрядности, ориентированный на параллельную обработку // Вычислительные методы и программирование: новые вычислительные технологии. 2014. Т. 15, №4. С. 631-643).

Способ организации выполнения операции умножения двух чисел в модулярно-логарифмическом формате представления с плавающей точкой на гибридных многоядерных процессорах, заключающийся в том, что:

в гибридном многоядерном вычислителе, содержащем n q-разрядных модулярных вычислительных ядер, одно k-разрядное и два r-разрядных универсальных целочисленных ядра, два специализированных s-разрядных векторных ядра, одно специализированное q-разрядное векторное ядро и одно специализированное управляющее ядро, выполняется система из операций, в состав которой входят операции арифметического умножения и арифметического сложения над числами, представленными в позиционных целочисленных форматах данных, операции скалярного произведения векторов n чисел, представленными в позиционных целочисленных форматах данных, операции передачи управления и информации между ядрами;

при организации выполнения операций умножения каждое число, множитель и множимое, представляется в модулярно-логарифмическом формате с плавающей точкой в виде (2+k+2⋅r+q⋅n) -элементного вектора, где:

первые два разряда слева σ являются старшими разрядами в формате числа и отводятся под значение знака числа, причем если σ=+1, то число считается положительным, если σ=-1, то число считается отрицательным, если σ=0, то число равно 0;

следующие за первыми двумя разрядами σ числа k разрядов отводятся под хранение порядка числа, представляющего собой целое двоичное число λ со знаком s_λ, изменяющееся для конечных чисел с плавающей точкой в диапазоне λ_min≤λ≤λ_mах и получаемое в результате преобразования числа из позиционного формата с плавающей точкой посредством вычисления выражения λ=е-t+1, где е определяет величину числа в двоичном позиционном формате с плавающей точкой в выражении -1^S⋅М⋅2^епри 0≤М≤2, являющейся рациональной t-разрядной мантиссой числа в двоичном позиционном формате с плавающей точкой, λ_min=2-2^k-1, λ_max=2^k-1-2, при s_λ=0, порядок λ считается положительным, а при s_λ=1 порядок λ считается отрицательным;

следующие за (k+2) разрядами 2⋅r разрядов отводятся под хранение интервальной логарифмической характеристики числа, представляющей собой пару целых двоичных чисел L_min, L_max без знака, изменяющихся в диапазоне 0≤L_min≤L_P, 0≤L_max≤L_P и получаемых в результате преобразования числа из позиционного формата с плавающей точкой -1^S⋅М⋅2^е посредством вычисления выражений L_min= L_max=L_min+1, где М' - целое неотрицательное двоичное число, определяемое выражением М'=М⋅2^t-1, М - рациональная t-разрядная мантисса числа в двоичном позиционном формате с плавающей точкой, - наибольшее целое, не превышающее log₂(M')⋅2^r-h-1, - наибольшее целое, не превышающее , - наибольшее целое, не превышающее

следующие за (2⋅r+k+2) разрядами q⋅n разрядов отводятся для представления мантиссы числав модулярно-логарифмическом формате, причем данная мантисса представляется в системе остаточных классов с n основаниями P₁, P₂, …, Р_n, n - количество знакопозиций мантиссы, q - разрядность каждой знакопозиции; причем каждая i-ая знакопозиция, где 1≤i≤n, представляется целым неотрицательным числом m_i в двоичной позиционной системе счисления; значение m_i каждой i-ой знакопозиции определяется по выражению m_i= , где М' - целое неотрицательное двоичное число, определяемое выражением М'=М⋅2^t-1, М - рациональная t-разрядная мантисса числа в двоичном позиционном формате с плавающей точкой, - операция получения остатка от деления М' на i-ое основание р_i;

диапазон изменения модулярной мантиссы в позиционной системе счисления определяется интервалом

значения порядка λ, мантиссы и верхней и нижней границ интервальной логарифмической характеристики L_min, L_max положительных конечных чисел при σ=+1 в модулярно-логарифмическом формате [〈m₁, m₂, …, m_n〉, L_min, L_max, λ, σ] находятся соответственно в следующих диапазонах: 2-2^k-1≤λ≤2^k-1-2, 0≤L_min≤L_P, 0≤L_max≤Lp,

значения порядка λ, мантиссы и интервальной логарифмической характеристики L_min, L_max отрицательных конечных чисел при σ=-1 в модулярно-логарифмическом формате находятся соответственно в следующих диапазонах: 2-2^k-1≤λ≤2^k-1-2, 0≤L_min≤L_P, 0≤L_max≤L_P;

значение машинного нуля представляется в модулярно логарифмическом формате следующим образом: σ=0, λ=0, L_min=0, L_max=0;

значение положительной бесконечности представляется в модулярно-логарифмическом формате следующим образом: σ=+1, λ=λ_mах+1=2^k-1-1, L_min=0, L_max=0;

значение отрицательной бесконечности представляется в модулярно-логарифмическом формате следующим образом: σ=-1, λ=λ_mаx+1=2^k-1-1, L_min=0, L_max=0;

для положительных нечисловых величин (NaN) в модулярно-логарифмическом формате при σ=+1 значение позиционного порядка λ определяется выражением λ=λ_mах+1=2^k-1-1, значение мантиссынаходится в диапазоне 〈1₁, 1₂, …, 1_n〉≤≤〈р₁-1), (р₂-1), …, (р₂-1)〉, значение верхней и нижней границ интервальной логарифмической характеристики L_min, L_max находятся в диапазонах 0≤L_min≤L_P, 0≤L_max≤L_P,

для отрицательных нечисловых величин (NaN) в модулярно-логарифмическом формате при σ=-1 значение позиционного порядка λ определяется выражением λ=λ_mах+1=2^k-1-1, значение мантиссынаходится в диапазоне 〈1₁, 1₂,…, 1_n〉≤≤ 〈р₁-1), (р₂-1), ..., (р₂-1)〉, значение верхней и нижней границ интервальной логарифмической характеристики L_min, L_max находятся в диапазонах 0≤L_min≤L_P, 0≤L_max≤L_P;

по сигналу процессора множитель и множимое представленные в модулярно-логарифмическом формате с плавающей точкой, загружают в гибридный многоядерный процессор следующим образом:

в первое модулярное ядро гибридного многоядерного процессора загружают q-разрядные двоичные представления первых знакопозиций и модулярных мантисс и чисел А и В соответственно, а также основание системы остаточных классов р₁ и значение мультипликативной инверсии Р₁ по модулю

параллельно с этим во второе модулярное ядро загружают q-разрядные двоичные представления вторых знакопозиций и модулярных мантисс и чисел А и В соответственно, а также основание системы остаточных классов р₂ и значение мультипликативной инверсии Р₂ по модулю

параллельно с этим в третье ÷ n-ое модулярные ядра загружают q-разрядные двоичные представления третьих ÷ n-ых знакопозиций и модулярных мантисс и чисел А и В соответственно, а также основания системы остаточных классов р₃÷р_n и значения мультипликативных инверсий Р₃÷Р_n по модулям р₃÷р_n

параллельно с этим в первое универсальное вычислительное ядро загружают k-разрядные двоичные порядки λ^А и λ^B, а также знаки σ^А и σ^B чисел А и В соответственно;

параллельно с этим во второе универсальное вычислительное ядро загружают r-разрядные значения нижних границ интервальных логарифмических характеристик и чисел А и В соответственно;

параллельно с этим в третье универсальное вычислительное ядро загружают r-разрядные значения верхних границ интервальных логарифмических характеристик и чисел А и В соответственно, а также r-разрядное значение нижней границы интервальной логарифмической характеристики диапазона представления модулярных мантисс L_P;

параллельно с этим в первое векторное вычислительное ядро загружают вектор s-разрядных коэффициентов

параллельно с этим во второе векторное вычислительное ядро загружают вектор s-разрядных коэффициентов

параллельно с этим в третье векторное вычислительное ядро загружают вектор q-разрядных остатков от деления

после того, как множитель и множимое загружены в гибридный многоядерный процессор, операция их умножения выполняется следующим образом:

в первом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₁ q-разрядных двоичных представлений знакопозиций и модулярных мантисс и чисел А и В соответственно, путем нахождения значения - наибольшее целое, не превышающее

все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₂ q-разрядных двоичных представлений знакопозиций и модулярных мантисс и чисел А и В соответственно;

параллельно с этим в третьем ÷ n-ом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₃÷ р_n q-разрядных двоичных представлений знакопозиций модулярных мантисс и чисел А и В соответственно;

параллельно с этим в первом универсальном вычислительном ядре процессора выполняется сложение λ^C=λ^A+λ^B двоичных порядков λ^А и λ^B, а также умножение σ^C=σ^А⋅σ^B знаков σ^А и σ^B чисел А и В соответственно;

параллельно с этим во втором универсальном вычислительном ядре процессора выполняется сложение двоичных значений нижних границ интервальных логарифмических характеристик чисел А и В соответственно;

параллельно с этим в третьем универсальном вычислительном ядре процессора выполняется сложение двоичных значений верхних границ интервальных логарифмических характеристик чисел А и В соответственно;

параллельно с этим в управляющем ядре вычисляются следующие значения поправочных коэффициентов: если если и L₂<0,z_B= если и если и

после того, как получено промежуточное значение произведения чисел и выполняется коррекция результата следующим образом:

в случае если знак промежуточного результата произведения чисел А и В не равен 0, и порядок промежуточного результата произведения чисел А и В принадлежит интервалу [2-2^k-1; 2^k-1-2], и значение верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В меньше значения нижней границы интервальной логарифмической характеристики максимально возможного значения мантиссы, то есть

то коррекции результата не требуется;

в случае если знак промежуточного результата произведения чисел А и В равен 0, то есть то:

в первом универсальном вычислительном ядре процессора выполняется обнуление двоичного порядка промежуточного результата произведения чисел А и В;

параллельно с этим во втором универсальном вычислительном ядре процессора выполняется обнуление двоичного значения нижней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В;

параллельно с этим в третьем универсальном вычислительном ядре процессора выполняется обнуление двоичного значения верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В;

в случае если знак промежуточного результата произведения чисел А и В не равен 0 и значение то есть модуль промежуточного результата произведения чисел А и В выходит за границы минимально возможного представления, то:

в первом универсальном вычислительном ядре процессора выполняется обнуление двоичного порядка и знака промежуточного результата произведения чисел А и В;

параллельно с этим в первом модулярном вычислительном ядре процессора выполняется обнуление значения первой знакопозиции промежуточного результата произведения чисел А и В;

параллельно с этим во втором модулярном вычислительном ядре процессора выполняется обнуление значения второй знакопозиции промежуточного результата произведения чисел А и В;

параллельно с этим в третьем ÷ n-ом модулярном вычислительном ядре процессора выполняется обнуление значения третьей ÷ n-ой знакопозиции промежуточного результата произведения чисел А и В;

в случае если знак промежуточного результата С произведения чисел А и В не равен 0 и значение то есть модуль промежуточного результата произведения чисел А и В выходит за границы максимально возможного представления, то:

в первом универсальном вычислительном ядре процессора выполняется присвоение двоичному порядку промежуточного результата произведения чисел А и В;

в случае если знак промежуточного результата произведения чисел А и В не равен 0, и порядок промежуточного результата произведения чисел А и В принадлежит интервалу и значение верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В меньше значения нижней границы интервальной логарифмической характеристики максимально возможного значения мантиссы то управляющее ядро передает во все модулярные и все универсальные целочисленные ядра значения поправочных коэффициентов после чего:

в первом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₁ знакопозиции модулярной мантиссы промежуточного результата произведения чисел А и В и значения следующим образом: выполняется операция целочисленного умножения по модулю р₁ знакопозиции модулярной мантиссы промежуточного результата произведения чисел А и В и значения полученного сдвигом числа 1 на двоичных разрядов влево, путем нахождения значения где - наибольшее целое, не превышающее затем, если j_C>0, то j_C раз выполняется операция целочисленного умножения по модулю р₁ знакопозиции модулярной мантиссы промежуточного результата произведения чисел А и В и значения 2^q-1, полученного сдвигом числа 1 на (q-1) двоичных разрядов влево, путем нахождения значения где - наибольшее целое, не превышающее все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₂ знакопозиции модулярной мантиссы промежуточного результата произведения чисел А и В и значения следующим образом: выполняется операция целочисленного умножения по модулю р₂; затем, если j_C>0, то j_C раз выполняется операция целочисленного умножения по модулю р₂;

параллельно с этим в третьем ÷ n-ом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₃÷р_n q-разрядного двоичного представления знакопозиции модулярной мантиссы промежуточного результата произведения чисел А и В и значения следующим образом: выполняется операция целочисленного умножения по модулю р₃÷р_n; затем, если j_C>0, то j_C раз выполняется операция целочисленного умножения по модулю р₃÷р_n;

параллельно с этим в первом универсальном вычислительном ядре процессора выполняется коррекция двоичного порядка промежуточного результата произведения чисел А и В;

параллельно с этим во втором универсальном вычислительном ядре процессора выполняется коррекция двоичного значения нижней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В;

параллельно с этим в третьем универсальном вычислительном ядре процессора выполняется коррекция двоичного значения верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В;

в случае если знак промежуточного результата произведения чисел А и В не равен 0, и порядок промежуточного результата С произведения чисел А и В принадлежит интервалу и значение верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В меньше значения нижней границы интервальной логарифмической характеристики максимально возможного значения мантиссы то управляющее ядро передает во все модулярные и все универсальные целочисленные ядра значение поправочного коэффициента после чего:

в первое модулярное ядро загружают q-разрядные двоичные значения и мультипликативных инверсий по модулю р₁;

параллельно с этим во второе модулярное ядро загружают q-разрядные двоичные значения и мультипликативных инверсий и 2^q-1 по модулю р₂;

параллельно с этим в третье ÷ n-ое модулярное ядро загружают q-разрядные двоичные значения и мультипликативных инверсий и 2^q-1 по модулю p₃÷р_n;

параллельно с этим в управляющем ядре вычисляется количество итераций j=0, если если

в случае если выполняется один цикл деления на 2^α, где затем, если количество итераций j≥1, выполняется j циклов деления на 2^α, где α=q-1;

цикл деления на 2^α состоит в следующем:

в первом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₁ q-разрядного двоичного представления знакопозиции модулярной мантиссы промежуточного результата произведения чисел А и В и значения мультипликативной инверсии P₁ по модулю путем нахождения значения где - наибольшее целое, не превышающее все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₂q-разрядного двоичного представления знакопозиции модулярной мантиссы промежуточного результата произведения чисел А и В и значения мультипликативной инверсии Р₂ по модулю

параллельно с этим в третьем ÷ n-ом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р_n _{q-разрядного двоичного представления знакопозиции модулярной мантиссы промежуточного результата произведения чисел А и В и значения мультипликативной инверсии Р_n по модулю}

после того, как получены значения элементов вектора данный вектор загружается в векторные ядра следующим образом:

в первое векторное вычислительное ядро загружают вектор q-разрядных элементов

параллельно с этим во второе векторное вычислительное ядро загружают вектор q-разрядных элементов

параллельно с этим в третье векторное вычислительное ядро загружают вектор q-разрядных элементов

после того, как элементы вектора загружены в векторные ядра, производится вычисление ранга и частичного остатка от деления на 2^q-1модулярной мантиссы промежуточного результата произведения чисел А и В:

- в первом векторном вычислительном ядре вычисляют скалярное произведение векторов и вычисляют значение где - наибольшее целое, не превышающее значение передается в управляющее ядро;

- параллельно с этим во втором векторном вычислительном ядре вычисляют скалярное произведение векторов и вычисляют значение где - наибольшее целое, не превышающее значение передается в управляющее ядро;

- параллельно с этим в третьем векторном вычислительном ядре вычисляют скалярное произведение векторов и значение передается в управляющее ядро;

после того, как результаты скалярного произведения векторов переданы в управляющее ядро, в управляющем ядре вычисляется значение ранга если или R=R_max, если и значение остатка от деления модулярной мантиссы промежуточного результата произведения чисел

после того, как управляющее ядро передаст во все модулярные и все универсальные целочисленные ядра значения и α, выполняется деление модулярной мантиссы промежуточного результата произведения чисел А и В на число 2^α:

в первом модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р₁ q-разрядного двоичного представления знакопозиции модулярной мантиссы промежуточного результата произведения чисел А и В и значения следующим образом: если то если то после чего выполняется операция умножения по модулю р₁ q-разрядного двоичного представления знакопозиции модулярной мантиссы промежуточного результата произведения чисел А и В и значения мультипликативной инверсии 2^α по модулю путем нахождения значения

- наибольшее целое, не превышающее после чего, если , выполняется операция сложения по модулю р₁ q-разрядного двоичного представления знакопозиции модулярной мантиссы промежуточного результата произведения чисел А и В следующим образом: если , если то все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р₂ q-разрядного двоичного представления знакопозиции модулярной мантиссы промежуточного результата произведения чисел А и В и значения после чего выполняется операция умножения по модулю р₂ q-разрядного двоичного представления знакопозиции и значения мультипликативной инверсии 2^α по модулю после чего, если , выполняется операция сложения по модулю р₂;

параллельно с этим в третьем ÷ n-ом модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р_1n q-разрядного двоичного представления знакопозиции модулярной мантиссы промежуточного результата произведения чисел А и В и значения после чего выполняется операция умножения по модулю р_n q-разрядного двоичного представления знакопозиции и значения мультипликативной инверсии 2^α по модулю после чего, если , выполняется операция сложения по модулю р_n;

параллельно с этим во втором универсальном вычислительном ядре процессора выполняется коррекция если иначе двоичного значения нижней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В;

параллельно с этим в третьем универсальном вычислительном ядре процессора выполняется коррекция если иначе двоичного значения верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В; цикл деления на 2^α заканчивается;

если знак промежуточного результата произведения чисел А и В не равен 0 и значение верхней границы интервальной логарифмической характеристики промежуточного результата произведения чисел А и В больше или равно значению нижней границы интервальной логарифмической характеристики максимально возможного значения мантиссы то управляющее ядро передает во все модулярные и все универсальные целочисленные ядра значение поправочных коэффициентов z_A, z_B, после чего:

в первое модулярное ядро загружают q-разрядные двоичные значения мультипликативных инверсий по модулю р₁;

параллельно с этим во второе модулярное ядро загружают q-разрядные двоичные значения и мультипликативных инверсий и 2^q-1 по модулю р_2;

параллельно с этим в третье ÷ n-ое модулярное ядро загружают q-разрядные двоичные значения и мультипликативных инверсий и 2^q-1 по модулю р₃÷р_n;

параллельно с этим в управляющем ядре вычисляется количество итераций j_A=0, если z_A≤q-1, если z_A>q-1 и j_B=0, если z_B≤q-1, если z_B>q-1.

в случае если выполняется один цикл деления на 2^α, где затем, если количество итераций j_A≥1, выполняется j_A циклов деленияна 2^α, где α=q-1;

цикл деления на 2^α состоит в следующем:

в первом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₁ q-разрядного двоичного представления знакопозиции модулярной мантиссы числа А и значения мультипликативной инверсии Р₁ по модулю р₁ , путем нахождения значения где - наибольшее целое, не превышающее все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₂q- разрядного двоичного представления знакопозиции модулярной мантиссы и значения мультипликативной инверсии Р₂ по модулю

в первое векторное вычислительное ядро загружают вектор q-разрядных элементов

параллельно с этим во второе векторное вычислительное ядро загружают вектор q-разрядных элементов

параллельно с этим в третье векторное вычислительное ядро загружают вектор q-разрядных элементов

после того, как элементы вектора загружены в векторные ядра производится вычисление ранга и частичного остатка от деления на 2^q-1модулярной мантиссы числа А следующим образом:

- в первом векторном вычислительном ядре вычисляют скалярное произведение векторов и вычисляют значение где - наибольшее целое, на превышающее значение передается в управляющее ядро;

после того, как результаты скалярного произведения векторов переданы в управляющее ядро, в управляющем ядре вычисляется значение ранга , если или если и значение остатка от деления модулярной мантиссы числа А

после того, как управляющее ядро передаст во все модулярные и все универсальные целочисленные ядра значения и α, выполняется деление модулярной мантиссы числа А на число 2^α:

в первом модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р₁ q-разрядного двоичного представления знакопозиции модулярной мантиссы числа А и значения следующим образом: если то если то после чего выполняется операция умножения по модулю р₁ q-разрядного двоичного представления знакопозиции модулярной мантиссы числа А и значения мультипликативной инверсии 2^α по

модулю P₁ путем нахождения значения - где - наибольшее целое, не превышающее после чего, если , выполняется операция сложения по модулю р₁ q-разрядного двоичного представления знакопозиции модулярной мантиссы числа А следующим образом: если то , если то все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р₂ q-разрядного двоичного представления знакопозиции модулярной мантиссы числа А и значения после чего выполняется операция умножения по модулю р₂ q-разрядного двоичного представления знакопозиции и значения мультипликативной инверсии 2^α по модулю после чего, если , выполняется операция сложения по модулю р₂;

параллельно с этим в третьем ÷ n-ом модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р₃÷р_n q-разрядного двоичного представления знакопозиции модулярной мантиссы числа А и значенияпосле чего выполняется операция умножения по модулю р₃÷р_n q-разрядного двоичного представления знакопозиции и значения мультипликативной инверсии 2^α по модулю после чего, если , выполняется операция сложения по модулю р₃÷р_n;

цикл деления завершается;

в случае если выполняется один цикл деления на 2^α, где α= затем если количество итераций j_B≥1, выполняется j_B циклов деления на 2^α, где α=q-1;

цикл деления на 2^α состоит в следующем:

в первом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₁ q-разрядного двоичного представления знакопозиции модулярной мантиссы числа В и значения мультипликативной инверсии Р₁ по модулю р₁ путем нахождения значения - наибольшее целое, не превышающее все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₂q-разрядного двоичного представления знакопозиции модулярной мантиссы и значения мультипликативной инверсии Р₂ по модулю

в первое векторное вычислительное ядро загружают вектор q-разрядных элементов

параллельно с этим во второе векторное вычислительное ядро загружают вектор q-разрядных элементов

параллельно с этим в третье векторное вычислительное ядро загружают вектор q-разрядных элементов

после того, как элементы вектора загружены в векторные ядра, производится вычисление ранга и остатка от деления на 2^q-1 следующим образом:

в первом векторном вычислительном ядре вычисляют скалярное произведение векторов и значение передается в управляющее ядро;

параллельно с этим во втором векторном вычислительном ядре вычисляют скалярное произведение векторов и значение передается в управляющее ядро;

параллельно с этим в третьем векторном вычислительном ядре вычисляют скалярное произведение векторов и значение передается в управляющее ядро;

после того, как результаты скалярного произведения векторов переданы в управляющее ядро, в управляющем ядре вычисляется значение ранга R^B=R^B_min, если если и значение остатка от деления модулярной мантиссы числа В

после того, как управляющее ядро передаст во все модулярные и все универсальные целочисленные ядра значения и α, выполняется деление модулярной мантиссы числа В на число 2^α:

в первом модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р₁ q-разрядного двоичного представления знакопозиции модулярной мантиссы, числа В и значения следующим образом: если то если то после чего выполняется операция умножения по модулю р₁ q-разрядного двоичного представления знакопозиции модулярной мантиссы числа В и значения мультипликативной инверсии 2^α по модулю p₁ путем нахождения значения - где - наибольшее целое, не превышающее после чего, если , выполняется операция сложения по модулю р₁ q-разрядного двоичного представления знакопозиции модулярной мантиссы числа В следующим образом: если то , если то все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р₂ q-разрядного двоичного представления знакопозиции модулярной мантиссы числа В и значения после чего выполняется операция умножения по модулю р₂ q-разрядного двоичного представления знакопозиции и значения мультипликативной инверсии 2^α по модулю после чего, если , выполняется операция сложения по модулю р₂;

параллельно с этим в третьем ÷ n-ом модулярном вычислительном ядре процессора выполняется операция вычитания по модулю р₃÷р_n q-разрядного двоичного представления знакопозиции модулярной мантиссычисла В и значения после чего выполняется операция умножения по модулю р₃÷р_n q-разрядного двоичного представления знакопозиции и значения мультипликативной инверсии 2^α по модулю после чего, если , выполняется операция сложения по модулю р₃÷р_n;

цикл деления на 2^α завершается;

после того, как выполнена коррекция мантисс и чисел А и В соответственно, выполняется их умножение следующим образом:

в первом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₁ q-разрядных двоичных представлений знакопозиций модулярных мантисс и чисел А и В соответственно, путем нахождения значения где - наибольшее целое, не превышающее

параллельно с этим во втором модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₂ q-разрядных двоичных представлений знакопозиций модулярных мантисс и чисел А и В соответственно; все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

параллельно с этим в третьем ÷ n-ом модулярном вычислительном ядре процессора выполняется операция целочисленного умножения по модулю р₃÷р_n q-разрядных двоичных представлений знакопозиций модулярных мантисс и чисел А и В соответственно; все операции являются целочисленными и выполняются в позиционной двоичной системе счисления;

в результате выполнения данных операций получается произведение чисел и представленное в модулярно-логарифмическом формате с плавающей точкой.

Изобретение относится к вычислительной технике и предназначено для генерации периодических идеальных троичных последовательностей (ИТП), являющихся последовательностями с идеальной периодической автокорреляционной функцией, и может быть использовано в системах фиксированной и мобильной связи, в радиолокации и навигации.

Устройство для сравнения двоичных чисел // 2665255

Изобретение относится к области цифровой вычислительной техники и автоматики. Технический результат заключается в повышении быстродействия устройства для сравнения двоичных чисел.

Мажоритарный элемент "5 и более из 9" // 2665226

Изобретение относится к области радиотехники. Технический результат – схемотехническое упрощение, сокращение номенклатуры и числа используемых логических элементов, обеспечение возможности реализации мажоритарного элемента на электронных компонентах с изменяемой архитектурой.

Схема формирователя управляющих сигналов // 2664014

Изобретение относится к вычислительной технике. Технический результат – повышение надежности и уменьшение массогабаритных показателей.

Квантовый генератор случайных чисел // 2662641

Изобретение относится к области вычислительной техники. Технический результат заключается в повышении скорости генерирования последовательности случайных чисел и обеспечении непрерывности выдаваемой последовательности случайных чисел.

Генератор случайных чисел и поточный шифр // 2661564

Группа изобретений относится к области шифрования и может быть использована для генерирования последовательности случайных чисел. Техническим результатом является повышение защищенности от криптографической атаки.

Программно-аппаратный комплекс для автоматической калибровки многопроекторных систем с возможностью воспроизводить контент в высоком разрешении с использованием средств шифрования и цифровой дистрибьюции, способ шифрования контента для использования в способе воспроизведения контента // 2657168

Изобретение относится к области формирования и отображения картинки на криволинейных экранах с помощью проекторов. Технический результат – повышение качества отображения лицензионного зашифрованного контента на криволинейной поверхности.

Арифметическое устройство по модулю м // 2656992

Изобретение относится к области автоматики и вычислительной техники и может быть использовано в вычислительных структурах, работающих с дискретно-фазированным представлением чисел модулярной системы счисления.

Универсальный асинхронный конвертор параллельного цифрового кода // 2656824

Изобретение относится к области представления и передачи цифровых сигналов. Техническим результатом является увеличение разрядности преобразуемого кода, повышение надежности и помехозащищенности схемы.

Процессоры, способы, системы и команды для сложения трех операндов-источников с плавающей запятой // 2656730

Группа изобретений относится к области вычислительной техники и может быть использована для сложения чисел с плавающей запятой. Техническим результатом является увеличение производительности.

Система моделирования ситуаций, относящихся к конфликтам и/или конкуренции // 2665045

Изобретение относится к системам моделирования. Технический результат заключается в обеспечении проведения имитационных экспериментов, связанных с моделированием взаимодействия крупномасштабных социально-технических систем с оценкой ресурсных потенциалов и условий конкурентного взаимодействия, анализа, выделения наиболее рационального сценария.

Способ автоматической реконструкции фотопортретов из скетчей и система для его осуществления // 2628125

Изобретение относится к автоматике и вычислительной технике. Технический результат – повышение быстродействия реконструкции фотопортретов из скетчей.

Устройство оптимизации алгоритмов адаптации и стабилизации летательного аппарата операторным методом // 2620280

Устройство оптимизации алгоритмов адаптации и стабилизации летательного аппарата операторным методом содержит блоки ввода данных продольного канала, бокового канала и канала крена, систему стабилизации, содержащую продольный канал, боковой канал и канал крена, модуль расчета перекрестных связей, модуль оптимизации системы стабилизации, модуль формирования критериев, модуль формирования результатов, модуль хранения данных, соединенные определенным образом.

Способы для аппроксимации операции умножения гессиана на вектор в полной инверсии волнового поля // 2613216

Изобретение относится к области геофизической разведки и, более конкретно, к обработке сейсмических данных. Техническим результатом является повышение скорости оценки величины, известной как умножение гессиана на вектор, которая возникает в некоторых способах для численного решения дифференциальных уравнений в частных производных.

Способ осуществления операции скалярного умножения произвольного вектора на загружаемый в устройство векторный коэффициент и опционального сложения со скалярным коэффициентом // 2609745

Изобретение относится к вычислительной технике и может использоваться для быстрого выполнения математических вычислений в нейронных сетях типа Multilayer Perceptron (MLP). Техническим результатом является уменьшение сложности устройства.

Способ устранения пространственных помех // 2575973

Изобретение относится к методам цифровых вычислений, предназначенных для специфических функций, а именно к комплексным математическим операциям для матричных или векторных вычислений.

Устройство обращения ковариационной матрицы помеховых сигналов // 2562389

Изобретение относится к вычислительной технике и может быть использовано в высокопроизводительных специализированных вычислительных машинах и устройствах обработки сигналов для обращения ковариационных матриц помеховых сигналов.

Способ и система для определения границ защиты с полной экстраполяцией на протяжении заданного временного горизонта // 2552160

Изобретение относится к вычислительной технике. Технический результат заключается в упрощении определения пределов защиты при помощи полной экстраполяции пределов защиты.

Способ организации арифметического ускорителя для решения больших систем линейных уравнений // 2547618

Изобретение относится к вычислительной технике и может быть использовано для создания арифметического ускорителя для решения больших систем линейных уравнений. Техническим результатом является уменьшение числа арифметических операций.

Устройство для моделирования процесса принятия решения в условиях неопределенности // 2534924

Изобретение относится к устройствам принятия решения в условиях неопределенности. Техническим результатом является расширение функциональных возможностей устройства за счет обеспечения возможности ранжирования вариантов принятия решения.

Способ и устройство для вычисления хэш-функции // 2666303

Группа изобретений относится к вычислительной технике и может быть использована для вычисления хэш-функции. Техническим результатом является повышение быстродействия вычислений, расширение возможности выбора конфигурации устройства. Устройство содержит блок предварительной подготовки, имеющий М входов размерностью k бит, при этом М>1; М блоков конвейерного вычисления, работающих параллельно, каждый из которых содержит модуль памяти, модуль отключения обратной связи, сумматор, конвейерный перемножитель, имеющий L каскадов, блок обратной связи и блок накопления; блок объединения. 2 н. и 4 з.п. ф-лы, 2 ил.