Устройство аудиокодера и устройство аудиодекодера, имеющие эффективное кодирование усиления при управлении динамическим диапазоном - заявка 2016141556 на патент на изобретение в РФ

1. Устройство аудиокодера, содержащее:
- аудиокодер (2), выполненный с возможностью формирования кодированного потока (ABS) битов аудио из аудиосигнала (AS), содержащего последовательные аудиокадры (AFP, AFR, AFS);
- кодер (3) для управления динамическим диапазоном, выполненный с возможностью формирования кодированного потока (DBS) битов управления динамическим диапазоном из последовательности (DS) управления динамическим диапазоном, соответствующей аудиосигналу (AS) и содержащей последовательные кадры (DFP, DFR, DFS) управления динамическим диапазоном, при этом каждый кадр (DFP, DFR, DFS) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном содержит один или более узлов (A0...A5; B0...B2; C0), при этом каждый узел из одного или более узлов (A0...A5; B0...B2; C0) содержит информацию (GA0...GA5; GB0...GB2; GC0) усиления для аудиосигнала (AS) и информацию (TA0...TA5; TB0...TB2; TC0) времени, указывающую то, какому моменту времени соответствует информация (GA0...GA5; GB0...GB2; GC0) усиления;
- при этом кодер (3) для управления динамическим диапазоном сконфигурирован таким образом, что кодированный поток (DBS) битов управления динамическим диапазоном содержит для каждого кадра (DFP, DFR, DFS) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном соответствующую часть (DFP', DFR', DFS') потока битов;
- при этом кодер (2) для управления динамическим диапазоном выполнен с возможностью выполнения процедуры сдвига, при этом один или более узлов (B1, B2) из узлов (B0...B2) одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном выбираются в качестве сдвинутых узлов (B1, B2), при этом битовое представление (B'1, B'2) каждого из одного или более сдвинутых узлов (B1, B2) одного опорного кадра (DFR) управления динамическим диапазоном встраивается в часть (DFS') потока битов, соответствующую кадру (DFS) управления динамическим диапазоном, следующему после одного опорного кадра (DFR) управления динамическим диапазоном, при этом битовое представление (B'0) каждого оставшегося узла (B0) из узлов (B0...B2) одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном встраивается в часть (DFR') потока битов, соответствующую одному опорному кадру (DFR) управления динамическим диапазоном.
2. Устройство аудиокодера по п. 1, в котором процедура сдвига инициируется в случае, если число узлов опорного кадра управления динамическим диапазоном превышает предварительно заданное пороговое значение.
3. Устройство аудиокодера по п. 1, в котором процедура сдвига инициируется в случае, если сумма числа узлов опорного кадра управления динамическим диапазоном и числа сдвинутых узлов из кадра управления динамическим диапазоном, предшествующего опорному кадру управления динамическим диапазоном, которые должны встраиваться в часть потока битов, соответствующую опорному кадру управления динамическим диапазоном, превышает предварительно заданное пороговое значение.
4. Устройство аудиокодера по п. 1, в котором процедура сдвига инициируется в случае, если сумма числа узлов (B0...B2) опорного кадра (DFR) управления динамическим диапазоном и числа сдвинутых узлов (A4, A5) из кадра (DFP) управления динамическим диапазоном, предшествующего опорному кадру (DFR) управления динамическим диапазоном, которые должны встраиваться в часть (DFR') потока битов, соответствующую опорному кадру (DFR) управления динамическим диапазоном, превышает число узлов (C0) кадра (DFS) управления динамическим диапазоном, следующего после опорного кадра (DFR) управления динамическим диапазоном.
5. Устройство аудиокодера по п. 1, в котором информация (TA0...TA5; TB0...TB2; TC0) времени одного или более узлов (A0...A5; B0...B2; C0) представлена таким образом, что один или более сдвинутых узлов (A4, A5; B1, B2) могут идентифицироваться посредством использования информации (TA4, TA5; TB1, TB2) времени.
6. Устройство аудиокодера по предшествующему пункту, в котором информация (TA4, TA5; TB1, TB2) времени одного или более сдвинутых узлов (A4, A5; B1, B2) представлена посредством суммы разности (t_A4, t_A5; t_B1, t_B2) времен от начала кадра (DFP; DFR) управления динамическим диапазоном, которому принадлежит соответствующий узел (A4, A5; B1, B2), до временной позиции соответствующего узла (A4, A5; B1, B2) в кадре (DFP; DFR) управления динамическим диапазоном, которому принадлежит соответствующий узел (A4, A5; B1, B2), и значения (drcFrameSize) смещения, превышающего или равного временному размеру кадра (DFR; DFS) управления динамическим диапазоном, следующего после соответствующего кадра (DFP; DFR) управления динамическим диапазоном.
7. Устройство аудиокодера по п. 1, в котором информация (GB1) усиления битового представления (B'1) сдвинутого узла (B1), который находится в первой позиции части (DFS') потока битов, соответствующей кадру (DFS) управления динамическим диапазоном, следующему после опорного кадра (DFR) управления динамическим диапазоном, представлена посредством значения (g_B1) абсолютного усиления, при этом информация (GB2) усиления каждого битового представления (B'2) сдвинутых узлов (B2) в позиции после битового представления (B'1) узла (B1), который находится в первой позиции части (DFS') потока битов, соответствующей кадру (DFS) управления динамическим диапазоном, следующему после опорного кадра (DFR) управления динамическим диапазоном, представлена посредством значения относительного усиления, которое равно разности значения (g_B2) усиления битового представления (B'2) соответствующего сдвинутого узла (B2) и значения (g_B1) усиления битового представления (B'1) узла (B1), которое предшествует битовому представлению (B'2) соответствующего узла (B2).
8. Устройство аудиокодера по п. 1, в котором, в случае если битовые представления (B'1, B'2) одного или более сдвинутых узлов (B1, B2) опорного кадра (DFR) управления динамическим диапазоном встраиваются в часть (DFS') потока битов, соответствующую кадру (DFS) управления динамическим диапазоном, следующему после опорного кадра (DFR) управления динамическим диапазоном, информация (GC0) усиления битового представления (C'0) узла (C0) последующего кадра (DFS) управления динамическим диапазоном в первой позиции части (DFS') потока битов, соответствующей кадру (DFS) управления динамическим диапазоном, следующему после опорного кадра (DFR) управления динамическим диапазоном после одной или более позиций битовых представлений (B'1, B'2) одного или более сдвинутых узлов (B1, B2), представлена посредством значения относительного усиления, которое равно разности значения (g_C0) усиления битового представления (C'0) соответствующего узла (C0) и значения (g_B2) усиления битового представления (B'2) сдвинутого узла (B2), которое предшествует битовому представлению (C'0) соответствующего узла (C0).
9. Устройство аудиокодера по п. 1, в котором временной размер аудиокадров (AFP, AFR, AFS) равен временному размеру кадров (DFP, DFR, DFS) управления динамическим диапазоном.
10. Устройство аудиокодера по п. 1, в котором один или более узлов (A0...A5; B0...B2; C0) одного из кадра (DFP, DFR, DFS) управления динамическим диапазоном выбираются из равномерной временной сетки.
11. Устройство аудиокодера по п. 1, в котором каждый узел (A0...A5; B0...B2; C0) из одного или более узлов содержит информацию (SA0...SA5; SB0...SB2; SC0) наклона для (A0...A5; B0...B2; C0).
12. Устройство аудиокодера по п. 1, в котором кодер (3) для управления динамическим диапазоном выполнен с возможностью кодирования узлов (A0...A5; B0...B2; C0) с использованием технологии энтропийного кодирования.
13. Устройство аудиодекодера, содержащее:
- аудиодекодер (5), выполненный с возможностью декодирования кодированного потока (ABS) битов аудио для того, чтобы воспроизводить аудиосигнал (AS), содержащий последовательные аудиокадры (AFP, AFR, AFS);
- декодер (6) для управления динамическим диапазоном, выполненный с возможностью декодирования кодированного потока (DBS) битов управления динамическим диапазоном, чтобы воспроизводить последовательность (DS) управления динамическим диапазоном, соответствующую аудиосигналу (AS) и содержащую последовательные кадры (DFP, DFR, DFS) управления динамическим диапазоном;
- при этом кодированный поток (DBS) битов управления динамическим диапазоном содержит для каждого кадра (DFP, DFR, DFS) управления динамическим диапазоном из кадров управления динамическим диапазоном соответствующую часть (DFP', DFR', DFS') потока битов;
- при этом кодированный поток (DBS) битов управления динамическим диапазоном содержит битовые представления (A'0...A'5; B'0...B'2; C'0) узлов (A0...A5; B0...B2; C0), при этом каждое битовое представление одного узла из узлов содержит информацию (GA0...GA5; GB0...GB2; GC0) усиления для аудиосигнала (AS) и информацию (TA0...TA5; TB0...TB2; TC0) времени, указывающую то, какому моменту времени соответствует информация (GA0...GA5; GB0...GB2; GC0) усиления;
- при этом кодированный поток (DBS) битов управления динамическим диапазоном содержит битовые представления (B'1, B'2) сдвинутых узлов (B1, B2), выбранных из узлов (B0...B2) одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном, которые встраиваются в часть потока битов, соответствующую кадру (DFS) управления динамическим диапазоном, следующему после одного опорного кадра (DFR) управления динамическим диапазоном, при этом битовое представление (B'0) каждого оставшегося узла (B0) из узлов (B0...B2) одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном встраивается в часть (DFR') потока битов, соответствующую одному опорному кадру (DFR) управления динамическим диапазоном; и
- при этом декодер (6) для управления динамическим диапазоном выполнен с возможностью декодирования битового представления (B'0) каждого оставшегося узла (B0) из оставшихся узлов (B'0) одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном, чтобы воспроизводить каждый оставшийся узел (B0) одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном, декодирования битового представления (B'1, B'2) каждого сдвинутого узла (B1, B2) из сдвинутых узлов (B1, B2), выбранных из узлов (B0...B2) одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном, чтобы воспроизводить каждый сдвинутый узел (B1, B2) из сдвинутых узлов (B1, B2), выбранных из узлов одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном, и комбинирования воспроизведенных оставшихся узлов (B0) и воспроизведенных сдвинутых узлов (B1, B2), чтобы восстанавливать опорный кадр (DFR) управления динамическим диапазоном.
14. Устройство аудиодекодера по п. 13, в котором декодер (6) для управления динамическим диапазоном выполнен с возможностью идентификации одного или более сдвинутых узлов (A4, A5; B1, B2) посредством использования информации (TA4, TA5; TB1, TB2) времени.
15. Устройство аудиодекодера по п. 13, в котором декодер (6) для управления динамическим диапазоном выполнен с возможностью декодирования информации (TA4, TA5; TB1, TB2) времени одного или более сдвинутых узлов (A4, A5; B1, B2), которая представлена посредством суммы разности (t_A4, t_A5; t_B1, t_B2) времен от начала кадра (DFP; DFR) управления динамическим диапазоном, которому принадлежит соответствующий узел (A4, A5; B1, B2), до временной позиции соответствующего узла (A4, A5; B1, B2) в кадре (DFP; DFR) управления динамическим диапазоном, которому принадлежит соответствующий узел (A4, A5; B1, B2), и значения (drcFrameSize) смещения, превышающего или равного временному размеру кадра (DFR; DFS) управления динамическим диапазоном, следующего после соответствующего кадра (DFP; DFR) управления динамическим диапазоном.
16. Устройство аудиодекодера по п. 13, в котором декодер (6) для управления динамическим диапазоном выполнен с возможностью декодирования информации (GB1) усиления битового представления (B'1) сдвинутого узла (B1), который находится в первой позиции части (DFS') потока битов, соответствующей кадру (DFS) управления динамическим диапазоном, следующему после опорного кадра (DFR) управления динамическим диапазоном, представлена посредством значения (g_B1) абсолютного усиления, при этом информация (GB2) усиления каждого битового представления (B'2) сдвинутых узлов (B2) в позиции после битового представления (B'1) узла (B1), который находится в первой позиции части (DFS') потока битов, соответствующей кадру (DFS) управления динамическим диапазоном, следующему после опорного кадра (DFR) управления динамическим диапазоном, представлена посредством значения относительного усиления, которое равно разности значения (g_B2) усиления битового представления B'2 соответствующего сдвинутого узла B2 и значения (g_B1) усиления битового представления (B'1) узла (B1), которое предшествует битовому представлению (B'2) соответствующего узла (B2)
17. Устройство аудиодекодера по п. 13, в котором декодер (6) для управления динамическим диапазоном выполнен с возможностью декодирования информации (GC0) усиления битового представления (C'0) узла (C0) последующего кадра (DFS) управления динамическим диапазоном в первой позиции части (DFS') потока битов, соответствующей кадру (DFS) управления динамическим диапазоном, следующему после опорного кадра (DFR) управления динамическим диапазоном после одной или более позиций битовых представлений (B'1, B'2) одного или более сдвинутых узлов (B1, B2), которая представлена посредством значения относительного усиления, которое равно разности значения (g_C0) усиления битового представления (C'0) соответствующего узла (C0) и значения (g_B2) усиления битового представления (B'2) сдвинутого узла (B2), которое предшествует битовому представлению (C'0) соответствующего узла (C0).
18. Устройство аудиодекодера по п. 13, в котором временной размер аудиокадров (AFP, AFR, AFS) равен временному размеру кадров (AFP, AFR, AFS) управления динамическим диапазоном.
19. Устройство аудиодекодера по п. 13, в котором один или более узлов (A0...A5; B0...B2; C0) одного из кадров (DFP, DFR, DFS) управления динамическим диапазоном выбираются из равномерной временной сетки.
20. Устройство аудиодекодера по п. 13, в котором каждый узел (A0...A5; B0...B2; C0) из одного или более узлов (A0...A5; B0...B2; C0) содержит информацию (SA0...SA5; SB0...SB2; SC0) наклона.
21. Устройство аудиодекодера по п. 13, в котором декодер (6) для управления динамическим диапазоном выполнен с возможностью декодирования битовых представлений узлов (A'0...A'5; B'0...B'2; C'0) с использованием технологии энтропийного декодирования.
22. Система, содержащая устройство (1) аудиокодера по одному из пп. 1-12 и устройство (4) аудиодекодера по одному из пп. 13-21.
23. Способ для управления аудиокодером, при этом способ содержит этапы, на которых:
- формируют кодированный поток (ABS) битов аудио из аудиосигнала (AS), содержащего последовательные аудиокадры (AFP, AFR, AFS);
- формируют кодированный поток (DBS) битов управления динамическим диапазоном из последовательности (DS) управления динамическим диапазоном, соответствующей аудиосигналу (AS) и содержащей последовательные кадры (DFP, DFR, DFS) управления динамическим диапазоном, при этом каждый кадр (DFP, DFR, DFS) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном содержит один или более узлов (A0...A5; B0...B2; C0), при этом каждый узел из одного или более узлов (A0...A5; B0...B2; C0) содержит информацию (GA0...GA5; GB0...GB2; GC0) усиления для аудиосигнала (AS) и информацию (TA0...TA5; TB0...TB2; TC0) времени, указывающую то, какому моменту времени соответствует информация усиления
- при этом кодированный поток (DBS) битов управления динамическим диапазоном содержит для каждого кадра (DFP, DFR, DFS) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном соответствующую часть (DFP', DFR', DFS') потока битов;
- выполняют процедуру сдвига, при этом один или более узлов (B1, B2) из узлов (B0...B2) одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном выбираются в качестве сдвинутых узлов (B1, B2), при этом битовое представление (B'1, B'2) каждого из одного или более сдвинутых узлов (B1, B2) одного опорного кадра (DFR) управления динамическим диапазоном встраивается в часть (DFS') потока битов, соответствующую кадру (DFS) управления динамическим диапазоном, следующему после одного опорного кадра (DFR) управления динамическим диапазоном, при этом битовое представление (B'0) каждого оставшегося узла (B0) из узлов (B0...B2) одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном встраивается в часть (DFR') потока битов, соответствующую одному опорному кадру (DFR) управления динамическим диапазоном.
24. Способ для управления аудиодекодером, при этом способ содержит этапы, на которых:
- декодируют кодированный поток (ABS) битов аудио для того, чтобы воспроизводить аудиосигнал (AS), содержащий последовательные аудиокадры (AFP, AFR, AFS);
- декодируют кодированный поток (DBS) битов управления динамическим диапазоном, чтобы воспроизводить последовательность (DS) управления динамическим диапазоном, соответствующую аудиосигналу (AS) и содержащую последовательные кадры (DFP, DFR, DFS) управления динамическим диапазоном;
- при этом кодированный поток (DBS) битов управления динамическим диапазоном содержит для каждого кадра (DFP, DFR, DFS) управления динамическим диапазоном из кадров управления динамическим диапазоном соответствующую часть (DFP', DFR', DFS') потока битов;
- при этом кодированный поток (DBS) битов управления динамическим диапазоном содержит битовые представления (A'0...A'5; B'0...B'2; C'0) узлов (A0...A5; B0...B2; C0), при этом каждое битовое представление одного узла из узлов содержит информацию (GA0...GA5; GB0...GB2; GC0) усиления для аудиосигнала (AS) и информацию (TA0...TA5; TB0...TB2; TC0) времени, указывающую то, какому моменту времени соответствует информация (GA0...GA5; GB0...GB2; GC0) усиления;
- при этом кодированный поток битов управления динамическим диапазоном (DBS) содержит битовые представления (B'1, B'2) сдвинутых узлов (B1, B2), выбранных из узлов (B0...B2) одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном, которые встраиваются в часть потока битов, соответствующую кадру (DFS) управления динамическим диапазоном, следующему после одного опорного кадра (DFR) управления динамическим диапазоном, при этом битовое представление (B'0) каждого оставшегося узла (B0) из узлов (B0...B2) одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном встраивается в часть (DFR') потока битов, соответствующую одному опорному кадру (DFR) управления динамическим диапазоном; и
- при этом битовое представление (B'0) каждого оставшегося узла (B0) из оставшихся узлов (B'0) одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном декодируется, чтобы воспроизводить каждый оставшийся узел (B0) одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном;
- при этом битовое представление (B'1, B'2) каждого сдвинутого узла (B1, B2) из сдвинутых узлов (B1, B2), выбранных из узлов (B0...B2) одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном, декодируется, чтобы воспроизводить каждый сдвинутый узел (B1, B2) из сдвинутых узлов (B1, B2), выбранных из узлов одного опорного кадра (DFR) управления динамическим диапазоном из кадров (DFP, DFR, DFS) управления динамическим диапазоном; и
- при этом воспроизведенные оставшиеся узлы (B0) и воспроизведенные сдвинутые узлы (B1, B2) комбинируются, чтобы восстанавливать опорный кадр (DFR) управления динамическим диапазоном.
25. Компьютерная программа для осуществления способа по одному из пп. 23 или 24 при выполнении на процессоре.
Наверх