Способ и устройство кодирования аудио - заявка 2017101813 на патент на изобретение в РФ

1. Способ кодирования аудио, в котором способ содержит:
определение разреженности распределения, по спектрам, энергии N входных аудиокадров, в котором N аудиокадров содержат текущий аудиокадр, и N представляет собой положительное целое число; и
определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, причем первый способ кодирования представляет собой способ кодирования, который основывается на частотно-временном преобразовании и квантовании коэффициентов преобразования, и который не основывается на линейном предсказании, и второй способ кодирования представляет собой способ кодирования на основе линейного предсказания.
2. Способ по п.1, в котором определение разреженности распределения, по спектрам, энергии N входных аудиокадров содержит:
деление спектра каждого из N аудиокадров на P огибающих спектра, причем P представляет собой положительное целое число; и
определение параметра общей разреженности в соответствии с энергией P огибающих спектра каждого из N аудиокадров, причем параметр общей разреженности указывает разреженность распределения, по спектрам, энергии N аудиокадров.
3. Способ по п.2, в котором параметр общей разреженности содержит первую минимальную ширину полосы;
определение параметра общей разреженности в соответствии с энергией P огибающих спектра каждого из N аудиокадров содержит:
определение среднего значения минимальных ширин полосы, распределенных по спектрам, энергии с первой заранее заданной пропорцией N аудиокадров в соответствии с энергией P огибающих спектра каждого из N аудиокадров, причем среднее значение минимальных ширин полосы, распределенных по спектрам, энергии с первой заранее заданной пропорцией N аудиокадров представляет собой первую минимальную ширину полосы; и
определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, содержит:
когда первая минимальная ширина полосы меньше первого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра; или, когда первая минимальная ширина полосы больше первого заранее заданного значения, определение использования второго способа кодирования для кодирования текущего аудиокадра.
4. Способ по п.3, в котором определение среднего значения минимальных ширин полосы, распределенных по спектрам, энергии с первой заранее заданной пропорцией N аудиокадров в соответствии с энергией P огибающих спектра каждого из N аудиокадров содержит:
сортировку энергии P огибающих спектра каждого аудиокадра в убывающем порядке;
определение, в соответствии с энергией, отсортированной в убывающем порядке, P огибающих спектра каждого из N аудиокадров, минимальной ширины полосы, распределенной по спектру, энергии, которая составляет не меньше первой заранее заданной пропорции каждого из N аудиокадров; и
определение, в соответствии с минимальной шириной полосы, распределенной по спектру, энергии, которая составляет не меньше первой заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше первой заранее заданной пропорции N аудиокадров.
5. Способ по п.2, в котором параметр общей разреженности содержит первую пропорцию энергии;
определение параметра общей разреженности в соответствии с энергией P огибающих спектра каждого из N аудиокадров содержит:
выбор P1 огибающих спектра из P огибающих спектра каждого из N аудиокадров; и
определение первой пропорции энергии в соответствии с энергией P1 огибающих спектра каждого из N аудиокадров и полной энергией соответствующих N аудиокадров, причем P1 представляет собой положительное целое число меньше P; и
определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, содержит:
когда первая пропорция энергии больше второго заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра; или, когда первая пропорция энергии меньше второго заранее заданного значения, определение использования второго способа кодирования для кодирования текущего аудиокадра.
6. Способ по п.5, в котором энергия любой одной из P1 огибающих спектра больше энергии любой одной из других огибающих спектра в P огибающих спектра, за исключением P1 огибающих спектра.
7. Способ по п.2, в котором параметр общей разреженности содержит вторую минимальную ширину полосы и третью минимальную ширину полосы;
определение параметра общей разреженности в соответствии с энергией P огибающих спектра каждого из N аудиокадров содержит:
определение среднего значения минимальных ширин полосы, распределенных по спектрам, энергии со второй заранее заданной пропорцией N аудиокадров и определение среднего значения минимальных ширин полосы, распределенных по спектрам, энергии с третьей заранее заданной пропорцией N аудиокадров в соответствии с энергией P огибающих спектра каждого из N аудиокадров, причем среднее значение минимальных ширин полосы, распределенных по спектрам, энергии со второй заранее заданной пропорцией N аудиокадров используется в качестве второй минимальной ширины полосы, среднее значение минимальных ширин полосы, распределенных по спектрам, энергии с третьей заранее заданной пропорцией N аудиокадров используется в качестве третьей минимальной ширины полосы, и вторая заранее заданная пропорция меньше третьей заранее заданной пропорции; и
определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра содержит:
когда вторая минимальная ширина полосы меньше третьего заранее заданного значения, и третья минимальная ширина полосы меньше четвертого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра;
когда третья минимальная ширина полосы меньше пятого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра; или,
когда третья минимальная ширина полосы больше шестого заранее заданного значения, определение использования второго способа кодирования для кодирования текущего аудиокадра, причем
четвертое заранее заданное значение больше или равно третьему заранее заданному значению, пятое заранее заданное значение меньше четвертого заранее заданного значения, и шестое заранее заданное значение больше четвертого заранее заданного значения.
8. Способ по п.7, в котором определение среднего значения минимальных ширин полосы, распределенных по спектрам, энергии со второй заранее заданной пропорцией N аудиокадров и определение среднего значения минимальных ширин полосы, распределенных по спектрам, энергии с третьей заранее заданной пропорцией N аудиокадров в соответствии с энергией P огибающих спектра каждого из N аудиокадров содержит:
сортировку энергии P огибающих спектра каждого аудиокадра в убывающем порядке;
определение, в соответствии с энергией, отсортированной в убывающем порядке, P огибающих спектра каждого из N аудиокадров, минимальной ширины полосы, распределенной по спектру, энергии, которая составляет не меньше второй заранее заданной пропорции каждого из N аудиокадров;
определение, в соответствии с минимальной шириной полосы, распределенной по спектру, энергии, которая составляет не меньше второй заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше второй заранее заданной пропорции N аудиокадров;
определение, в соответствии с энергией, отсортированной в убывающем порядке, P огибающих спектра каждого из N аудиокадров, минимальной ширины полосы, распределенной по спектру, энергии, которая составляет не меньше третьей заранее заданной пропорции каждого из N аудиокадров; и
определение, в соответствии с минимальной шириной полосы, распределенной по спектру, энергии, которая составляет не меньше третьей заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше третьей заранее заданной пропорции N аудиокадров.
9. Способ по п.2, в котором параметр общей разреженности содержит вторую пропорцию энергии и третью пропорцию энергии;
определение параметра общей разреженности в соответствии с энергией P огибающих спектра каждого из N аудиокадров содержит:
выбор P2 огибающих спектра из P огибающих спектра каждого из N аудиокадров;
определение второй пропорции энергии в соответствии с энергией P2 огибающих спектра каждого из N аудиокадров и полной энергией соответствующих N аудиокадров;
выбор P3 огибающих спектра из P огибающих спектра каждого из N аудиокадров; и
определение третьей пропорции энергии в соответствии с энергией P3 огибающих спектра каждого из N аудиокадров и полной энергией соответствующих N аудиокадров, причем P2 и P3 представляют собой положительные целые числа меньше P, и P2 меньше P3; и
определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, содержит:
когда вторая пропорция энергии больше седьмого заранее заданного значения, и третья пропорция энергии больше восьмого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра;
когда вторая пропорция энергии больше девятого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра; или,
когда третья пропорция энергии меньше десятого заранее заданного значения, определение использования второго способа кодирования для кодирования текущего аудиокадра.
10. Способ по п.9, в котором P2 огибающих спектра представляют собой P2 огибающих спектра, имеющих максимальную энергию в P огибающих спектра; и
P3 огибающих спектра представляют собой P3 огибающих спектра, имеющих максимальную энергию в P огибающих спектра.
11. Способ по п.1, в котором разреженность распределения энергии по спектрам содержит глобальную разреженность, локальную разреженность и кратковременный всплеск распределения энергии по спектрам.
12. Способ по п.11, в котором N равно 1, и N аудиокадров представляют собой текущий аудиокадр; и
определение разреженности распределения, по спектрам, энергии N входных аудиокадров содержит:
деление спектра текущего аудиокадра на Q подполос; и
определение параметра разреженности всплесков в соответствии с пиковой энергией каждой из Q подполос спектра текущего аудиокадра, причем параметр разреженности всплесков используется для указания глобальной разреженности, локальной разреженности и кратковременного всплеска текущего аудиокадра.
13. Способ по п.12, в котором параметр разреженности всплесков содержит: глобальную пропорцию пиковой энергии к средней каждой из Q подполос, локальную пропорцию пиковой энергии к средней каждой из Q подполос и кратковременное отклонение пиковой энергии каждой из Q подполос, причем глобальная пропорция пиковой энергии к средней определяется в соответствии с пиковой энергией в подполосе и средней энергией во всех подполосах текущего аудиокадра, локальная пропорция пиковой энергии к средней определяется в соответствии с пиковой энергией и подполосе и средней энергией в подполосе, и кратковременное отклонение пиковой энергии определяется в соответствии с пиковой энергией в подполосе и пиковой энергией в конкретной полосе частот аудиокадра перед этим аудиокадром; и
определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, содержит:
определение, имеется ли первая подполоса в Q подполосах, причем локальная пропорция пиковой энергии к средней первой подполосы больше одиннадцатого заранее заданного значения, глобальная пропорция пиковой энергии к средней первой подполосы больше двенадцатого заранее заданного значения, и кратковременное отклонение пиковой энергии первой подполосы больше тринадцатого заранее заданного значения; и,
когда имеется первая подполоса в Q подполосах, определение использования первого способа кодирования для кодирования текущего аудиокадра.
14. Способ по п.1, в котором разреженность распределения энергии по спектрам содержит ограниченные полосой характеристики распределения энергии по спектрам.
15. Способ по п.14, в котором определение разреженности распределения, по спектрам, энергии N входных аудиокадров содержит:
определение разграничительной частоты каждого из N аудиокадров; и
определение параметра ограниченной полосой разреженности в соответствии с разграничительной частотой каждого из N аудиокадров.
16. Способ по п.15, в котором параметр ограниченной полосой разреженности представляет собой среднее значение разграничительных частот N аудиокадров; и
определение, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, содержит:
когда определяется, что параметр ограниченной полосой разреженности аудиокадров меньше четырнадцатого заранее заданного значения, определение использования первого способа кодирования для кодирования текущего аудиокадра.
17. Устройство, в котором устройство содержит:
блок получения, выполненный с возможностью получения N аудиокадров, причем N аудиокадров содержат текущий аудиокадр, и N представляет собой положительное целое число; и
блок определения, выполненный с возможностью определения разреженности распределения, по спектрам, энергии N аудиокадров, полученных блоком получения; и
блок определения дополнительно выполнен с возможностью определения, в соответствии с разреженностью распределения, по спектрам, энергии N аудиокадров, использовать ли первый способ кодирования или второй способ кодирования для кодирования текущего аудиокадра, причем первый способ кодирования представляет собой способ кодирования, который основывается на частотно-временном преобразовании и квантовании коэффициентов преобразования, и который не основывается на линейном предсказании, и второй способ кодирования представляет собой способ кодирования на основе линейного предсказания.
18. Устройство по п.17, в котором
блок определения конкретно выполнен с возможностью деления спектра каждого из N аудиокадров на P огибающих спектра, и определения параметра общей разреженности в соответствии с энергией P огибающих спектра каждого из N аудиокадров, причем P представляет собой положительное целое число, и параметр общей разреженности указывает разреженность распределения, по спектрам, энергии N аудиокадров.
19. Устройство по п.18, в котором параметр общей разреженности содержит первую минимальную ширину полосы;
блок определения конкретно выполнен с возможностью определения среднего значения минимальных ширин полосы, распределенных по спектрам, энергии с первой заранее заданной пропорцией N аудиокадров в соответствии с энергией P огибающих спектра каждого из N аудиокадров, причем среднее значение минимальных ширин полосы, распределенных по спектрам, энергии с первой заранее заданной пропорцией N аудиокадров представляет собой первую минимальную ширину полосы; и
блок определения конкретно выполнен с возможностью: когда первая минимальная ширина полосы меньше первого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; и, когда первая минимальная ширина полосы больше первого заранее заданного значения, определения использования второго способа кодирования для кодирования текущего аудиокадра.
20. Устройство по п.19, в котором блок определения конкретно выполнен с возможностью: сортировки энергии P огибающих спектра каждого аудиокадра в убывающем порядке; определения, в соответствии с энергией, отсортированной в убывающем порядке, P огибающих спектра каждого из N аудиокадров, минимальной ширины полосы, распределенной по спектру, энергии, которая составляет не меньше первой заранее заданной пропорции каждого из N аудиокадров; и определения, в соответствии с минимальной шириной полосы, распределенной по спектру, энергии, которая составляет не меньше первой заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше первой заранее заданной пропорции N аудиокадров.
21. Устройство по п.18, в котором параметр общей разреженности содержит первую пропорцию энергии;
блок определения конкретно выполнен с возможностью выбора P1 огибающих спектра из P огибающих спектра каждого из N аудиокадров, и определения первой пропорции энергии в соответствии с энергией P1 огибающих спектра каждого из N аудиокадров и полной энергией соответствующих N аудиокадров, где P1 представляет собой положительное целое число меньше P; и
блок определения конкретно выполнен с возможностью: когда первая пропорция энергии больше второго заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; и, когда первая пропорция энергии меньше второго заранее заданного значения, определения использования второго способа кодирования для кодирования текущего аудиокадра.
22. Устройство по п.21, в котором блок определения конкретно выполнен с возможностью определения P1 огибающих спектра в соответствии с энергией P огибающих спектра, где энергия любой одной из P1 огибающих спектра больше энергии любой одной из других огибающих спектра в P огибающих спектра, за исключением P1 огибающих спектра.
23. Устройство по п.18, в котором параметр общей разреженности содержит вторую минимальную ширину полосы и третью минимальную ширину полосы;
блок определения конкретно выполнен с возможностью определения среднего значения минимальных ширин полосы, распределенных по спектрам, энергии со второй заранее заданной пропорцией N аудиокадров и определения среднего значения минимальных ширин полосы, распределенных по спектрам, энергии с третьей заранее заданной пропорцией N аудиокадров в соответствии с энергией P огибающих спектра каждого из N аудиокадров, причем среднее значение минимальных ширин полосы, распределенных по спектрам, энергии со второй заранее заданной пропорцией N аудиокадров используется в качестве второй минимальной ширины полосы, среднее значение минимальных ширин полосы, распределенных по спектрам, энергии с третьей заранее заданной пропорцией N аудиокадров используется в качестве третьей минимальной ширины полосы, и вторая заранее заданная пропорция меньше третьей заранее заданной пропорции; и
блок определения конкретно выполнен с возможностью: когда вторая минимальная ширина полосы меньше третьего заранее заданного значения, и третья минимальная ширина полосы меньше четвертого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; когда третья минимальная ширина полосы меньше пятого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; и, когда третья минимальная ширина полосы больше шестого заранее заданного значения, определения использования второго способа кодирования для кодирования текущего аудиокадра, причем
четвертое заранее заданное значение больше или равно третьему заранее заданному значению, пятое заранее заданное значение меньше четвертого заранее заданного значения, и шестое заранее заданное значение больше четвертого заранее заданного значения.
24. Устройство по п.23, в котором блок определения конкретно выполнен с возможностью: сортировки энергии P огибающих спектра каждого аудиокадра в убывающем порядке; определения, в соответствии с энергией, отсортированной в убывающем порядке, P огибающих спектра каждого из N аудиокадров, минимальной ширины полосы, распределенной по спектру, энергии, которая составляет не меньше второй заранее заданной пропорции каждого из N аудиокадров; определения, в соответствии с минимальной шириной полосы, распределенной по спектру, энергии, которая составляет не меньше второй заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше второй заранее заданной пропорции N аудиокадров; определения, в соответствии с энергией, отсортированной в убывающем порядке, P огибающих спектра каждого из N аудиокадров, минимальной ширины полосы, распределенной по спектру, энергии, которая составляет не меньше третьей заранее заданной пропорции каждого из N аудиокадров; и определения, в соответствии с минимальной шириной полосы, распределенной по спектру, энергии, которая составляет не меньше третьей заранее заданной пропорции каждого из N аудиокадров, среднего значения минимальных ширин полосы, распределенных по спектрам, энергии, которая составляет не меньше третьей заранее заданной пропорции N аудиокадров.
25. Устройство по п.18, в котором параметр общей разреженности содержит вторую пропорцию энергии и третью пропорцию энергии;
блок определения конкретно выполнен с возможностью: выбора P2 огибающих спектра из P огибающих спектра каждого из N аудиокадров, определения второй пропорции энергии в соответствии с энергией P2 огибающих спектра каждого из N аудиокадров и полной энергией соответствующих N аудиокадров, выбора P3 огибающих спектра из P огибающих спектра каждого из N аудиокадров, и определения третьей пропорции энергии в соответствии с энергией P3 огибающих спектра каждого из N аудиокадров и полной энергий соответствующих N аудиокадров, причем P2 и P3 представляют собой положительные целые числа меньше P, и P2 меньше P3; и
блок определения конкретно выполнен с возможностью: когда вторая пропорция энергии больше седьмого заранее заданного значения, и третья пропорция энергии больше восьмого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; когда вторая пропорция энергии больше девятого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра; и, когда третья пропорция энергии меньше десятого заранее заданного значения, определения использования второго способа кодирования для кодирования текущего аудиокадра.
26. Устройство по п.25, в котором блок определения конкретно выполнен с возможностью определения, из P огибающих спектра каждого из N аудиокадров, P2 огибающих спектра, имеющих максимальную энергию, и определения, из P огибающих спектра каждого из N аудиокадров, P3 огибающих спектра, имеющих максимальную энергию.
27. Устройство по п.17, в котором N равно 1, и N аудиокадров представляют собой текущий аудиокадр; и
блок определения конкретно выполнен с возможностью деления спектра текущего аудиокадра на Q подполос и определения параметра разреженности всплесков в соответствии с пиковой энергией каждой из Q подполос спектра текущего аудиокадра, причем параметр разреженности всплесков используется для указания глобальной разреженности, локальной разреженности и кратковременного всплеска текущего аудиокадра.
28. Устройство по п.27, в котором блок определения конкретно выполнен с возможностью определения глобальной пропорции пиковой энергии к средней каждой из Q подполос, локальной пропорции пиковой энергии к средней каждой из Q подполос и кратковременного отклонения пиковой энергии каждой из Q подполос, причем глобальная пропорция пиковой энергии к средней определяется блоком определения в соответствии с пиковой энергией в подполосе и средней энергией во всех подполосах текущего аудиокадра, локальная пропорция пиковой энергии к средней определяется блоком определения в соответствии с пиковой энергией в подполосе и средней энергией в подполосе, и кратковременное отклонение пиковой энергии определяется в соответствии с пиковой энергией в подполосе и пиковой энергией в конкретной полосе частот аудиокадра перед этим аудиокадром; и
блок определения конкретно выполнен с возможностью: определения, имеется ли первая подполоса в Q подполосах, причем локальная пропорция пиковой энергии к средней первой подполосы больше одиннадцатого заранее заданного значения, глобальная пропорция пиковой энергии к средней первой подполосы больше двенадцатого заранее заданного значения, и кратковременное отклонение пиковой энергии первой подполосы больше тринадцатого заранее заданного значения; и, когда имеется первая подполоса в Q подполосах, определения использования первого способа кодирования для кодирования текущего аудиокадра.
29. Устройство по п.17, в котором блок определения конкретно выполнен с возможностью определения разграничительной частоты каждого из N аудиокадров; и
блок определения конкретно выполнен с возможностью определения параметра ограниченной полосой разреженности в соответствии с разграничительной частотой каждого из N аудиокадров.
30. Устройство по п.29, в котором параметр ограниченной полосой разреженности представляет собой среднее значение разграничительных частот N аудиокадров; и
блок определения конкретно выполнен с возможностью: когда определяется, что параметр ограниченной полосой разреженности аудиокадров меньше четырнадцатого заранее заданного значения, определения использования первого способа кодирования для кодирования текущего аудиокадра.
Наверх