Способ и устройство для определения наименьшего целого числа битов, требуемого для представления недифференцируемых значений коэффициентов усиления, для сжатия представления кадра данных hoa - заявка 2016151121 на патент на изобретение в РФ

1. Способ определения сжатия представления (C(k)) кадра данных HOA наименьшего целого числа βe битов для описания представлений недифференцируемых значений коэффициентов усиления, соответствующих изменениям амплитуды в качестве показателя «два» () для сигналов каналов кадров данных HOA, в котором каждый сигнал канала в каждом кадре содержит группу значений выборки и в котором каждому сигналу (y1(k – 2), … , yI(k – 2)) канала каждого одного из кадров данных HOA присваивают дифференцируемое значение коэффициента усиления, при этом дифференцируемое значение коэффициента усиления вызывает изменение амплитуд (15, 151) первых значений выборки сигнала канала в текущем кадре ((k – 2)) данных HOA по отношению ко вторым значениям выборки сигнала канала в предыдущем кадре ((k – 3)) данных HOA, и при этом результирующие сигналы каналов с адаптированным коэффициентом усиления кодируют в кодирующем устройстве (16);
и при этом представление кадра данных HOA выполняют в пространственной области для O сигналов wj(t) виртуальных громкоговорителей, при этом положения виртуальных громкоговорителей лежат на единичной сфере и должны быть распределены равномерно по этой единичной сфере, при этом указанное воспроизведение представляют произведением матриц w(t) = (Ψ)-1 ⋅ c(t), где w(t) – вектор, содержащий все сигналы виртуальных громкоговорителей, Ψ – модовая матрица виртуальных положений громкоговорителей, и c(t) – вектор соответствующих последовательностей коэффициентов HOA представления кадра данных HOA;
и при этом указанное представление (C(k)) (C(k)) кадра данных HOA нормализуют таким образом, что ||w( t )| | = max 1jO | w j ( t )|1t,
при этом способ включает:
- формирование сигналов каналов посредством:
a) умножения вектора последовательностей c(t) коэффициентов HOA на матрицу смешивания Α для представления доминирующих звуковых сигналов (x(t)) в сигналах каналов, при этом матрица смешивания Α представляет линейную комбинацию последовательностей коэффициентов нормализованного представления кадра данных HOA;
b) вычитания доминирующих звуковых сигналов из нормализованного представления кадра данных HOA для представления компонента cAMB(t) окружающей среды в сигналах каналов, и преобразования результирующего минимального компонента cAMB,MIN(t) окружающей среды путем вычисления w MIN ( t )= Ψ MIN 1 c AMB,MIN ( t ), где || Ψ MIN 1 | | 2 <1, и ΨMIN – модовая матрица для указанного минимального компонента cAMB,MIN(t) окружающей среды;
c) выбора части последовательностей c(t) коэффициентов HOA, которые относятся к последовательностям коэффициентов компонента окружающей среды HOA, к которым применяют пространственное преобразование;
- определение целого числа βe битов исходя из
β e = log 2 ( log 2 ( K MAX O ) +1 ) ,
где K MAX = max 1N N MAX K( N, Ω 1 ( N ) ,, Ω O ( N ) ) – порядок; NMAX – максимальный порядок, представляющий интерес; Ω 1 ( N ) ,, Ω O ( N ) – направления указанных виртуальных громкоговорителей; O = (N + 1)2 – число последовательностей коэффициентов HOA; и K – отношение между квадратом евклидовой нормы ||Ψ||22 указанной модовой матрицы и O.
2. Способ по п. 1, отличающийся тем, что в дополнение к указанному преобразованному минимальному компоненту окружающей среды непреобразованные последовательности коэффициентов окружающей среды компонента cAMB(t) окружающей среды включают в сигнал (y1(k – 2), … , yI(k – 2)) канала.
3. Способ по пп. 1 или 2, отличающийся тем, что представления недифференцируемых значений ( 2 e ) коэффициентов усиления, связанных с указанными сигналами каналов из конкретных указанных кадров данных HOA, передают в качестве дополнительной информации, при этом каждое из них представляют в виде βe битов.
4. Способ по любому из пп. 1—2, отличающийся тем, что целое число βe битов устанавливают как β e = log 2 ( log 2 ( K MAX O ) + e max +1 ) , где e max ≥0 служит для увеличения количества битов βe исходя из определения того, что амплитуды значений выборки сигнала канала перед регулятором (15, 151) усиления ниже порогового значения.
5. Способ по любому из пп. 1—2, отличающийся тем, что K MAX =1,5.
6. Способ по любому из пп. 1—2, отличающийся тем, что указанную матрицу A смешивания определяют таким образом, чтобы свести к минимуму евклидову норму остатка между исходным представлением HOA и представлением доминирующих звуковых сигналов, полагая, что псевдоинверсия Мура-Пенроуза модовой матрицы сформирована из всех векторов, представляющих распределение по направлениям монофонических доминирующих звуковых сигналов.
7. Способ по любому из пп. 1—2, отличающийся тем, что исходя из определения того, что положения O сигналов виртуальных громкоговорителей не совпадают с положениями, предполагаемыми для вычисления βe, включающего:
- вычисление (51) модовой матрицы Ψ исходя из несовпадающих положений виртуальных громкоговорителей;
- вычисление (52) евклидовой нормы ||Ψ||2 модовой матрицы;
- вычисление (53) максимально допустимого значения амплитуды γ=min( 1, O K MAX,DES ||Ψ| | 2 ), которое замещает максимально допустимую амплитуду в указанной нормализации;
при этом K MAX,DES = max 1N N MAX,DES K( N, Ω DES,1 ( N ) ,, Ω DES,O ( N ) ); N – порядок; O = (N + 1)2 – число последовательностей коэффициентов HOA; K – отношение между квадратом евклидовой нормы указанной модовой матрицы и O; и где NMAX,DES – порядок, представляющий интерес, и Ω DES,1 ( N ) ,, Ω DES,1 ( N ) являются для каждого порядка направлениями виртуальных громкоговорителей, которые допускают для реализации указанного сжатия указанного представления (C(k)) кадра данных HOA, так что βe выбирают в виде β e = log 2 ( log 2 ( K MAX,DES O ) +1 ) , для кодирования показателей (e) по основанию «2» указанных недифференцируемых значений коэффициентов усиления.
8. Устройство для определения сжатия представления (C(k)) кадра данных HOA наименьшего целого числа βe битов для описания представлений недифференцируемых значений коэффициентов усиления, соответствующих изменениям амплитуды в качестве показателя «два» () для сигналов каналов кадров данных HOA,
при этом каждый сигнал канала в каждом кадре содержит группу значений выборки и при этом каждому сигналу (y1(k – 2), … , yI(k – 2)) канала каждого одного из кадров данных HOA присвоено дифференцируемое значение коэффициента усиления, при этом дифференцируемое значение коэффициента усиления вызывает изменение амплитуд (15, 151) первых значений выборки сигнала канала в текущем кадре ((k – 2)) данных HOA по отношению ко вторым значениям выборки сигнала канала в предыдущем кадре ((k – 3)) данных HOA, и при этом результирующие сигналы каналов с адаптированным коэффициентом усиления кодированы в кодирующем устройстве (16);
и при этом представление (C(k)) кадра данных HOA выполнено в пространственной области для O сигналов wj(t) виртуальных громкоговорителей, при этом положения виртуальных громкоговорителей лежат на единичной сфере и должны быть распределены равномерно по этой единичной сфере; при этом указанное выполнение представлено перемножением матриц w(t) = (Ψ)-1 ⋅ c(t), где w(t) – вектор, содержащий все сигналы виртуальных громкоговорителей; Ψ – модовая матрица положений виртуальных громкоговорителей; и c(t) – вектор соответствующих последовательностей коэффициентов HOA представления кадра данных HOA;
и при этом указанное представление (C(k)) кадра данных HOA нормализовано таким образом, что ||w( t )| | = max 1jO | w j ( t )|1t;
при этом указанное устройство содержит:
- средства (12, 13, 14), формирующие указанные сигналы (y1(k – 2), … , yI(k – 2)) каналов посредством:
a) умножения указанного вектора последовательностей c(t) коэффициентов HOA на матрицу смешивания Α для представления доминирующих звуковых сигналов (x(t)) в указанных сигналах каналов, при этом матрица смешивания Α представляет линейную комбинацию последовательностей коэффициентов нормализованного представления кадра данных HOA;
b) вычитания доминирующих звуковых сигналов из нормализованного представления кадра данных HOA для представления компонента cAMB(t) окружающей среды в сигналах каналов, и преобразования результирующего минимального компонента cAMB,MIN(t) окружающей среды путем вычисления w MIN ( t )= Ψ MIN 1 c AMB,MIN ( t ), где || Ψ MIN 1 | | 2 <1, и ΨMIN – модовая матрица для указанного минимального компонента cAMB,MIN(t) окружающей среды;
c) выбора части последовательностей c(t) коэффициентов HOA, которые относятся к последовательностям коэффициентов компонента окружающей среды HOA, к которым применено пространственное преобразование;
- средства (15,..., 151), которые определяют целое число βe битов исходя из
β e = log 2 ( log 2 ( K MAX O ) +1 ) ,
где K MAX = max 1N N MAX K( N, Ω 1 ( N ) ,, Ω O ( N ) ) – порядок; NMAX – максимальный порядок, представляющий интерес; Ω 1 ( N ) ,, Ω O ( N ) – направления указанных виртуальных громкоговорителей; O = (N + 1)2 – число последовательностей коэффициентов HOA; и K – отношение между квадратом евклидовой нормы ||Ψ||22 указанной модовой матрицы и O.
9. Устройство по п. 8, отличающееся тем, что в дополнение к указанному преобразованному минимальному компоненту окружающей среды непреобразованные последовательности коэффициентов окружающей среды компонента cAMB(t) окружающей среды включены в сигнал (y1(k – 2), … , yI(k – 2)) канала.
10. Устройство по любому из пп. 8—9, отличающееся тем, что представления недифференцируемых значений ( 2 e ) коэффициентов усиления, связанных с указанными сигналами каналов из конкретных указанных кадров данных HOA, переданы в качестве дополнительной информации, при этом каждое из них представлено в виде βe битов.

11     Устройство по любому из пп. 8—9, отличающееся тем, что целое число βe битов установлено как β e = log 2 ( log 2 ( K MAX O ) + e max +1 ) , при этом e max ≥0 служит для увеличения количества битов βe исходя из определения того, что амплитуды значений выборки сигнала канала перед регулятором (15, 151) усиления ниже порогового значения.
12. Устройство по любому из пп. 8—9, отличающееся тем, что K MAX =1,5.
13. Устройство по любому из пп. 8—9, отличающееся тем, что указанная матрица смешивания Α определена таким образом, чтобы свести к минимуму евклидову норму остатка между исходным представлением HOA и представлением доминирующих звуковых сигналов, полагая, что псевдоинверсия Мура-Пенроуза модовой матрицы сформирована из всех векторов, представляющих распределение по направлениям монофонических доминирующих звуковых сигналов.
14. Устройство по любому из пп. 8—9, отличающееся тем, что исходя из определения того, что положения O сигналов виртуальных громкоговорителей не совпадают с положениями, предполагаемыми для вычисления βe, включающего:
- вычисление (51) модовой матрицы Ψ исходя из несовпадающих положений виртуальных громкоговорителей;
- вычисление (52) евклидовой нормы ||Ψ||2 модовой матрицы;
- вычисление (53) максимально допустимого значения амплитуды γ=min( 1, O K MAX,DES ||Ψ| | 2 ), которое замещает максимально допустимую амплитуду в указанной нормализации,
при этом K MAX,DES = max 1N N MAX,DES K( N, Ω DES,1 ( N ) ,, Ω DES,O ( N ) ); N – порядок; O = (N + 1)2 – число последовательностей коэффициентов HOA; K – отношение между квадратом евклидовой нормы указанной модовой матрицы и O; и где NMAX,DES – порядок, представляющий интерес, и Ω DES,1 ( N ) ,, Ω DES,1 ( N ) являются для каждого порядка направлениями виртуальных громкоговорителей, допускаемыми для реализации указанного сжатия указанного представления (C(k)) кадра данных HOA, так что βe выбрано в виде β e = log 2 ( log 2 ( K MAX,DES O ) +1 ) , для кодирования показателей (e) по основанию «2» указанных недифференцируемых значений коэффициентов усиления.
15. Кодированное представление B кадра данных HOA, содержащее недифференцируемые значения коэффициентов усиления, в которых наименьшее целое число (βe) битов, требуемых для представления этих недифференцируемых значений коэффициентов усиления, определено согласно способу по одному из пп. 1—7.
16. Запоминающая среда, которая содержит, или хранит, или имеет записанное на ней кодированное представление ( B ) кадра данных HOA по п. 15.
17. Запоминающая среда, которая содержит, или хранит, или имеет записанный на ней компьютерный программный продукт, содержащий инструкции, которые при выполнении на компьютере выполняют способ по пп. 1—7.
18. Способ декодирования сжатого звукового представления с помощью воспроизводящей аппаратуры более высокого порядка (НОА) звука или звукового поля, при этом способ включает:
прием битового потока, содержащего сжатое представление НОА, при этом битовый поток содержит ряд коэффициентов HOA, соответствующих сжатому представлению HOA; и
декодирование сжатого представления НОА исходя из наименьшего целого числа βe, при этом наименьшее целое число βe определяют исходя из β e = log 2 ( log 2 ( K MAX O ) +1 ) , где K MAX = max 1N N MAX K( N, Ω 1 ( N ) ,, Ω O ( N ) ) – порядок; NMAX – максимальный порядок, представляющий интерес; Ω 1 ( N ) ,, Ω O ( N ) – направления указанных виртуальных громкоговорителей; O = (N + 1)2 – число последовательностей коэффициентов HOA; и K – отношение между квадратом евклидовой нормы ||Ψ||22 указанной модовой матрицы и O.
19. Способ по п. 18, отличающийся тем, что K MAX =1,5.
20. Устройство декодирования сжатого звукового представления с помощью воспроизводящей аппаратуры более высокого порядка (НОА) звука или звукового поля, при этом устройство содержит:
средства для приема битового потока, содержащего сжатое представление НОА, при этом битовый поток содержит ряд коэффициентов HOA, соответствующих сжатому представлению HOA; и
средства для декодирования сжатого представления НОА исходя из наименьшего целого числа βe, при этом наименьшее целое число βe определено исходя из β e = log 2 ( log 2 ( K MAX O ) +1 ) , где K MAX = max 1N N MAX K( N, Ω 1 ( N ) ,, Ω O ( N ) ) – порядок; NMAX – максимальный порядок, представляющий интерес; Ω 1 ( N ) ,, Ω O ( N ) – направления указанных виртуальных громкоговорителей; O = (N + 1)2 – число последовательностей коэффициентов HOA; и K – отношение между квадратом евклидовой нормы ||Ψ||22 указанной модовой матрицы и O.
21. Устройство по п. 20, отличающееся тем, что K MAX =1,5.
Наверх