Устройство предоставления источника звука и способ предоставления источника звука

Авторы патента:

МОРИ Хисаюки (JP)

КИМ Боо Ан (KR)

G10L19 - Техника анализа-синтеза речи для уменьшения избыточности, например в вокодерах ; кодирование или декодирование речи

Владельцы патента RU 2383940:

НЕК КОРПОРЕЙШН (JP)
ОНИОНТЕК (KR)

Изобретение предоставляет устройство предоставления источника звука, допускающее воспроизведение музыки с меньшим ухудшением качества звука путем обработки исходного источника звука так, чтобы музыка не определялась как шум. Согласно настоящему изобретению можно получить устройство (20) предоставления источника звука для предоставления услуги воспроизведения музыки посредством портативного терминала (105), при этом устройство предоставления источника звука имеет устройство (200) хранения файлов источника звука для предварительного сохранения множества типов обработанных файлов (202 и 203) источника звука, создаваемых посредством обработки исходного источника звука музыки, так чтобы уменьшить ухудшение качества звука, согласно множеству типов характеристик кодеков; и устройство (300) воспроизведения источника звука для определения типа (106) кодека портативного терминала (105) из стартового сигнала, указывающего запрос на воспроизведение, когда устройство воспроизведения источника звука принимает стартовый сигнал, воспроизведения одного обработанного файла источника звука, соответствующего определенному типу кодека, выборочно из множества типов обработанных файлов (202 и 203) источника звука и предоставления одного обработанного файла источника звука в портативный терминал (105), с тем чтобы воспроизводить музыку посредством портативного терминала. Технический результат - уменьшить ухудшение качества звука согласно характеристикам кодека для услуги прослушивания музыки посредством портативного терминала. 4 н. и 10 з.п. ф-лы, 7 ил., 2 табл.

Область техники, к которой относится изобретение

Настоящее изобретение относится к устройству предоставления источника звука и способу предоставления источника звука для хранения в качестве файла источника звука, музыки, которая должна быть воспроизведена посредством портативного терминала, воспроизведения и предоставления файла источника звука в портативный терминал, с тем чтобы воспроизводить музыку посредством портативного терминала.

Уровень техники

Публикация выложенной патентной заявки Японии номер 3-123269 (ссылка 1) раскрывает телефонную станцию, которая сохраняет речь тонального сигнала возврата вызова или тонального сигнала занятости в телефонной станции и отвечает вызывающему телефону речью.

Публикация выложенной патентной заявки Японии номер 3-191645 (ссылка 2) раскрывает телефон, допускающий распознавание тонального сигнала возврата вызова или тонального сигнала занятости и вывод результата распознавания с помощью речи.

Публикация выложенной патентной заявки Японии номер 9-162978 (ссылка 3) раскрывает то, что сообщения с изображениями/речью, которые должны быть отправлены от абонента в вызывающее устройство, предварительно регистрируются в коммутаторе и сообщения с изображениями/речью отправляются в вызывающее устройство до или в ходе посылки вызова, когда абонент принимает вызов.

Опубликованная заявка Японии номер 2003-505937 (ссылка 4) раскрывает методику для отправки коммерческой информации в виде речи/текста/изображения вместо тонального сигнала возврата вызова.

Тем не менее, ни одна из ссылок 1-4 не уделяет внимания воспроизведению музыки посредством портативного терминала, имеющего кодек.

Фиг.1 иллюстрирует систему, имеющую традиционное устройство 10 предоставления источника звука. Система, показанная на фиг.1, имеет традиционное устройство 10 предоставления источника звука, шлюзовой коммутатор (GS) 102, мобильный коммутационный центр (MSC) 103, базовую станцию 104 и сотовый телефон 105 в качестве портативного терминала. В частности, сотовый телефон 105 является терминалом GSM (глобальная система мобильной связи) и имеет аудиокодек 106, называемый кодеком RPE-LTP (долговременное предсказание с регулярным возбуждением импульсами). Шлюзовой коммутатор 102 и мобильный коммутационный центр 103 формируют коммутируемую сеть.

Традиционное устройство 10 предоставления источника звука имеет устройство 100 хранения файлов источника звука для сохранения файла 201 источника звука (далее упоминаемого как исходный файл источника звука) в WAV-формате 128 кбит/с (формат стандартного звукового файла Windows®, также называемый WAVE) и устройство 101 воспроизведения источника звука (устройство мелодий набора номера).

Файл 201 источника звука отправляется как PCM-сигнал (импульсно-кодовой модуляции) µ-типа или PCM-сигнал А-типа при 64 кбит/с посредством устройства 101 воспроизведения источника звука. Шлюзовой коммутатор 102 и мобильный коммутационный центр 103 непосредственно передают файл источника звука при 64 кбит/с. Соответственно, не происходит ухудшения качества звука файла источника звука в шлюзовом коммутаторе 102 и мобильном коммутационном центре 103.

Сигнал преобразуется в сигнал беспроводной области с помощью того же аудиокодека (кодека RPE-LTP) 107, что и аудиокодек 106 сотового телефона 105, посредством базовой станции 104. В случае, если пользователь только прослушивает музыку, аудиокодек 107 базовой станции 104 преобразует PCM-сигнал в кодированный GSM-сигнал, а аудиокодек 106 сотового телефона 105 преобразует кодированный GSM-сигнал в PCM-сигнал. Сотовый телефон 105 преобразует PCM-сигнал в аналоговый сигнал и воспроизводит музыку с помощью динамика для владельца сотового телефона и т.п. В случае, если пользователь говорит, сотовый телефон 105 выполняет преобразование, обратное преобразованию для прослушивания музыки. В этом случае сотовый телефон 105 преобразует речь с микрофона в PCM-сигнал, и аудиокодек 106 сотового телефона 105 преобразует PCM-сигнал в кодированный GSM-сигнал. Аудиокодек 107 базовой станции 104 преобразует кодированный GSM-сигнал в PCM-сигнал.

Поскольку полоса пропускания между базовой станцией 104 и сотовым телефоном 105 узкая, выполняется процесс кодирования, специализированный для человеческой речи. Соответственно, некоторые кадры в музыке рассматриваются не как речь, а как шум. Таким образом, поскольку шумовые кадры передаются вместо музыки, качество звука ухудшается.

Другими словами, кодек 106, специализированный для речи, используется в традиционном воспроизведении источника звука вследствие узкой полосы пропускания между базовой станцией 104 и сотовым телефоном 105. Следовательно, существует проблема в том, что качество звука для музыки не может поддерживаться.

Эта проблема традиционного воспроизведения источника звука описывается подробнее.

В ответ на запрос на воспроизведение музыки готовый файл 201 источника звука присоединяется к сети сотовой телефонии (включающей в себя шлюзовой коммутатор 102, мобильный коммутационный центр 103 и базовую станцию 104) в аудиорежиме (64 кбит/с, PCM) и воспроизводится. В сотовом телефоне 105, в частности, в узкополосном сотовом телефоне, ухудшение качества звука вызывается характеристиками кодека беспроводной области. Соответственно, есть проблема в том, что музыка не может предоставляться с высоким качеством.

Аудиокодек 106, используемый в сотовом телефоне 105, предназначен для того, чтобы передавать только человеческую речь, даже в узкой полосе пропускания.

Таким образом, аудиокодек 106 использует способ кодирования, специализированный для человеческой речи. С другой стороны, считается, что музыка частично включает в себя белый шум. Таким образом, поскольку музыка отличается от человеческой речи, форма сигнала музыки подавляется так, что ухудшается качество звука.

Сущность изобретения

Проблемы, разрешаемые изобретением

Причины ухудшения качества звука заключаются в следующем. Хотя причины и условия ухудшения качества различаются в зависимости от типов кодеков, причины ухудшения качества в GSM описываются ниже в качестве примера.

В GSM, если посредством VAD (опознавание активности речи) определено, что сигнал не является речью, то кадр передается как кадр SID (бесшумный дескриптор). Первоначальное назначение этого состоит в том, чтобы предоставлять шум SID-кадра в паузе после речи, к примеру, "Hello", чтобы тем самым не допускать окружающих звуков, к примеру, звуков автомобилей. Если посредством VAD определено, что музыка не является речью, то кадр передается как SID-кадр. Соответственно, значительный шум выводится вследствие SID-кадра. Хотя три типа кодеков, в том числе полноскоростной, полускоростной и усовершенствованный полноскоростной, имеют различные способы кодирования, логика VAD также применима к этим трем типам.

Настоящее изобретение направлено на то, чтобы изменить работу VAD для предотвращения ухудшения качества звука, поскольку работа VAD является основной причиной ухудшения качества звука.

В частности, задача настоящего изобретения заключается в том, чтобы создать устройство предоставления источника звука и способ предоставления источника звука, допускающие воспроизведение музыки с меньшим ухудшением качества звука за счет анализа логики определения между звуком и шумом в используемом кодеке и обработки исходного источника звука так, чтобы не определялось, что музыка является шумом.

Средство разрешения проблем

Устройство предоставления источника звука согласно настоящему изобретению и способ предоставления источника звука согласно настоящему изобретению следующие.

(1) Устройство предоставления источника звука для предоставления услуги воспроизведения музыки посредством портативного терминала отличается тем, что оно содержит

устройство хранения файлов источника звука для предварительного сохранения множества типов обработанных файлов источника звука, создаваемых посредством обработки исходного источника звука музыки, так чтобы уменьшить ухудшение качества звука, согласно множеству типов характеристик кодеков; и

устройство воспроизведения источника звука для определения типа кодека портативного терминала из стартового сигнала, указывающего запрос на воспроизведение, когда устройство воспроизведения источника звука принимает стартовый сигнал, воспроизведения одного обработанного файла источника звука, соответствующего определенному типу кодека, выборочно из множества типов обработанных файлов источника звука, и предоставления одного обработанного файла источника звука в портативный терминал, с тем чтобы воспроизводить музыку посредством портативного терминала.

(2) Устройство предоставления источника звука по п.(1) отличается тем, что

устройство воспроизведения источника звука определяет тип кодека портативного терминала на основе информации вызывающего абонента, включенной в стартовый сигнал, когда оно принимает стартовый сигнал, указывающий запрос на воспроизведение.

(3) Устройство предоставления источника звука по п.(1) отличается тем, что

любой из множества типов обработанных файлов источника звука создан посредством обработки исходного источника звука, с тем чтобы подавить, по меньшей мере, один кадр, который считается шумом, если исходный источник звука не обработан, из аудиокадров в исходном источнике звука.

(4) Устройство предоставления источника звука по п.(3) отличается тем, что

любой из множества типов обработанных файлов источника звука создан посредством обработки исходного источника звука, с тем чтобы подавить множество последовательных кадров, начиная с кадра, который считается шумом, если исходный источник звука не обработан, из аудиокадров в исходном источнике звука.

(5) Устройство предоставления источника звука по п.(4) отличается тем, что

любой из множества типов обработанных файлов источника звука создан посредством обработки исходного источника звука, с тем чтобы подавить три последовательных кадра, начиная с кадра, который считается шумом, если исходный источник звука не обработан, из аудиокадров в исходном источнике звука.

(6) Способ предоставления источника звука для предоставления услуги воспроизведения музыки посредством портативного терминала отличается тем, что он содержит

этап, на котором предварительно сохраняют множества типов обработанных файлов источника звука, созданных посредством обработки исходного источника звука музыки, так чтобы уменьшить ухудшение качества звука, согласно множеству типов характеристик кодеков;

этап определения типа, на котором определяют тип кодека портативного терминала из стартового сигнала, указывающего запрос на воспроизведение, при приеме стартового сигнала; и

этап, на котором воспроизводят один обработанный файл источника звука, соответствующий определенному типу кодека, выборочно из множества типов обработанных файлов источника звука и предоставляют один обработанный файл источника звука в портативный терминал, с тем чтобы воспроизводить музыку посредством портативного терминала.

(7) Способ предоставления источника звука по п.(6) отличается тем, что

этап определения типа содержит этап, на котором определяют тип кодека портативного терминала на основе информации вызывающего абонента, включенной в стартовый сигнал, при приеме стартового сигнала, указывающего запрос на воспроизведение.

(8) Способ предоставления источника звука по п.(6) отличается тем, что

любой из множества типов обработанных файлов источника звука создают посредством обработки исходного источника звука, с тем чтобы подавить, по меньшей мере, один кадр, который считается шумом, если исходный источник звука не обработан, из аудиокадров в исходном источнике звука.

(9) Способ предоставления источника звука по п.(8) отличается тем, что

любой из множества типов обработанных файлов источника звука создают посредством обработки исходного источника звука, с тем чтобы подавить множество последовательных кадров, начиная с кадра, который считается шумом, если исходный источник звука не обработан, из аудиокадров в исходном источнике звука.

(10) Способ предоставления источника звука по п.(9) отличается тем, что

любой из множества типов обработанных файлов источника звука создают посредством обработки исходного источника звука, с тем чтобы подавить три последовательных кадра, начиная с кадра, который считается шумом, если исходный источник звука не обработан, из аудиокадров в исходном источнике звука.

(11) Устройство предоставления источника звука для предоставления услуги воспроизведения музыки посредством портативного терминала отличается тем, что оно содержит

устройство хранения файлов источника звука для предварительного сохранения обработанного файла источника звука, созданного посредством обработки исходного источника звука музыки, так чтобы уменьшить ухудшение качества звука, согласно характеристикам кодека портативного терминала; и

устройство воспроизведения источника звука для воспроизведения обработанного файла источника звука, когда устройство воспроизведения источника звука принимает стартовый сигнал, указывающий запрос на воспроизведение, и предоставления обработанного файла источника звука в портативный терминал, с тем чтобы воспроизводить музыку посредством портативного терминала,

при этом обработанный файл источника звука создан посредством обработки исходного источника звука, с тем чтобы подавить, по меньшей мере, один кадр, который считается шумом, если исходный источник звука не обработан, из аудиокадров в исходном источнике звука.

(12) Устройство предоставления источника звука по п.(11) отличается тем, что

обработанный файл источника звука создан посредством обработки исходного источника звука, с тем чтобы подавить множество последовательных кадров, начиная с кадра, который считается шумом, если исходный источник звука не обработан, из аудиокадров в исходном источнике звука.

(13) Устройство предоставления источника звука по п.(12) отличается тем, что

обработанный файл источника звука создан посредством обработки исходного источника звука, с тем чтобы подавить три последовательных кадра, начиная с кадра, который считается шумом, если исходный источник звука не обработан, из аудиокадров в исходном источнике звука.

(14) Способ предоставления источника звука для предоставления услуги воспроизведения музыки посредством портативного терминала отличается тем, что он содержит

этап, на котором предварительно сохраняют обработанный файл источника звука, созданный посредством обработки исходного источника звука музыки, так чтобы уменьшить ухудшение качества звука, согласно характеристикам кодека портативного терминала; и

этап, на котором воспроизводят обработанный файл источника звука при приеме стартового сигнала, указывающего запрос на воспроизведение, и предоставляют обработанный файл источника звука в портативный терминал, с тем чтобы воспроизводить музыку посредством портативного терминала,

при этом обработанный файл источника звука создают посредством обработки исходного источника звука, с тем чтобы подавить, по меньшей мере, один кадр, который считается шумом, если исходный источник звука не обработан, из аудиокадров в исходном источнике звука.

(15) Способ предоставления источника звука по п.(14) отличается тем, что

обработанный файл источника звука создают посредством обработки исходного источника звука, с тем чтобы подавить, по меньшей мере, один кадр, который считается шумом, если исходный источник звука не обработан, из аудиокадров в исходном источнике звука.

(16) Способ предоставления источника звука по п.(15) отличается тем, что

обработанный файл источника звука создают посредством обработки исходного источника звука, с тем чтобы подавить множество последовательных кадров, начиная с кадра, который считается шумом, если исходный источник звука не обработан, из аудиокадров в исходном источнике звука.

(17) Способ предоставления источника звука по п.(16) отличается тем, что

обработанный файл источника звука создают посредством обработки исходного источника звука, с тем чтобы подавить три последовательных кадра, начиная с кадра, который считается шумом, если исходный источник звука не обработан, из аудиокадров в исходном источнике звука.

Преимущества изобретения

Согласно настоящему изобретению, поскольку файл источника звука, обрабатываемый так, чтобы соответствовать кодеку портативного терминала, в который должна передаваться музыка, соединен с портативным терминалом, музыка может воспроизводиться с меньшим ухудшением качества звука.

Краткое описание чертежей

Фиг.1 - это пояснительная схема системы, имеющей традиционное устройство предоставления источника звука;

Фиг.2 - это пояснительная схема системы, имеющей устройство предоставления источника звука согласно варианту осуществления настоящего изобретения;

Фиг.3 - это пояснительная схема исходного файла источника звука и обработанного файла источника звука (для GSM), используемого в системе, проиллюстрированной на фиг.2;

Фиг.4 - это блок-схема последовательности операций способа, иллюстрирующая краткий алгоритм обработки файла источника звука для GSM, используемого в системе, проиллюстрированной на фиг.2;

Фиг.5 - это пояснительная схема части алгоритма обработки файла источника звука для GSM, проиллюстрированного на фиг.4;

Фиг.6 - это граф, иллюстрирующий изменения качества звука (pvad) и порогового значения шума (thvad) файла источника звука, используемого в системе, проиллюстрированной на фиг.1; и

Фиг.7 - это граф, иллюстрирующий изменения качества звука (pvad) и порогового значения шума (thvad) файла источника звука, используемого в системе, проиллюстрированной на фиг.2.

Пояснение к номерам и обозначениям ссылок

10 - Устройство предоставления источника звука

100 - Устройство хранения файлов источника звука

101 - Устройство воспроизведения источника звука

102 - Шлюзовой переключатель (GS)

103 - Мобильный коммутационный центр (MSC)

104 - Базовая станция

105 - Сотовый телефон

106 - Аудиокодек

107 - Аудиокодек

20 - Устройство предоставления источника звука

200 - Устройство хранения файлов источника звука

201 - Файл источника звука или исходный файл источника звука

202 - Обработанный файл источника звука (для GSM)

203 - Обработанный файл источника звука (для cdma)

300 - Устройство воспроизведения источника звука

Оптимальный режим осуществления изобретения

Как описано выше, настоящее изобретение имеет следующие признаки. Источник звука обрабатывается так, чтобы уменьшить ухудшение качества звука согласно характеристикам кодека (КОдера-ДЕКодера) портативного терминала для услуги прослушивания музыки посредством портативного терминала. Множество типов обработанных файлов источника звука предварительно создается и сохраняется. Посредством выбора и воспроизведения оптимального файла источника звука, соответствующего типу кодека, в ответ на запрос на воспроизведение можно воспроизводить музыку с наивысшим качеством звука.

В устройстве предоставления источника звука согласно настоящему изобретению устройство воспроизведения источника звука определяет тип кодека портативного терминала на основе IAM (начального адресного сообщения) типа вызывающей сети, включенного в стартовый сигнал, и выбирает оптимальный источник звука, обработанный так, чтобы соответствовать типу кодека.

Таким образом, согласно настоящему изобретению, специальный файл источника звука, имеющий меньшее ухудшение качества звука, выбирается и воспроизводится согласно кодеку. Следовательно, можно воспроизводить музыку с меньшим ухудшением качества звука согласно кодеку портативного терминала.

Далее описывается суть настоящего изобретения. Согласно настоящему изобретению, файл источника звука обрабатывается так, чтобы уменьшить ухудшение качества звука даже при использовании узкополосной телефонной сети. Эта методика обработки является сутью настоящего изобретения.

Состояние ухудшения качества звука зависит от алгоритма кодирования типа кодека, используемого в сотовой телефонной сети. Соответственно, способ обработки файла источника звука должен быть изменяем для каждого кодека. Ухудшение качества воспроизведения музыки может быть предотвращено посредством определения сотовой телефонной сети вызывающего абонента, выбора и подключения файла источника звука, обработанного для кодека, используемого в этой сотовой телефонной сети.

Основные сотовые телефонные сети, типы кодеков и полосы пропускания перечислены ниже в таблице 1.

Таблица 1 Кодек и полоса пропускания для каждой системы
Система	Кодек	Полоса пропускания	Полоса пропускания звука (кбит/с)
PHS	ADPCM	32	32
PDC полноскоростная	VSELP	11,2	6,7
PDC полускоростная	PSI-CELP	5,6	3,45
GSM полноскоростная	PRE-LTP	22,8	13
GSM полноскоростная	VSELP	11,5	5,6
GSM EFR	A-CELP	13	7,4
CdmaOne	EVRC	9,6	8
Стационарная телефонная сеть (для справки)	PCM	64	64

Примечание. Полоса пропускания - это полоса для всех сигналов (кбит/с), а полоса пропускания звука - это полоса, в которой передаются звуковые сигналы (кбит/с).

Здесь PHS - это система персональных мобильных телефонов, ADPCM - адаптивная дифференциальная импульсно-кодовая модуляция, PDC - персональная цифровая сотовая связь, VSELP - линейное предсказание с возбуждением векторной суммой, PSI-CELP линейное предсказание с возбуждением кодом и новшеством синхронного основного тона, RPE-LTP - долговременное предсказание с регулярным возбуждением импульсами, EFR - усовершенствованный полноскоростной кодек, A-CELP - линейное предсказание с возбуждением алгебраическим кодом, Cdma - множественный доступ с кодовым разделением каналов, и EVRC - усовершенствованный кодек с переменной скоростью.

В нижеприведенном варианте осуществления настоящего изобретения описывается случай, когда абонент GSM-сети прослушивает музыку посредством "услуги мелодий набора номера". Здесь "услуга мелодий при наборе номера" - это услуга воспроизведения музыки, указанной B, вместо тонального сигнала возврата вызова для A, когда A вызывает B (услуга мелодий при возврате вызова).

В GSM-сети предусмотрено три типа кодеков, в том числе полноскоростной, полускоростной и EFR (усовершенствованный полноскоростной кодек). Различные кодеки используются в зависимости от несущих. Соответственно, различные меры противодействия (различные способы обработки звуковых источников) предпринимаются, чтобы справляться с различными несущими. Некоторые несущие используют множество кодеков.

Ссылаясь на фиг.2, проиллюстрирована система, имеющая устройство 20 предоставления источника звука для осуществления способа предоставления источника звука согласно варианту осуществления настоящего изобретения. Система, проиллюстрированная на фиг.2, включает в себя те же части, обозначенные теми же номерами ссылок, что и в системе, проиллюстрированной на фиг.1, за исключением устройства 20 предоставления источника звука.

Устройство 20 предоставления источника звука согласно варианту осуществления настоящего изобретения имеет устройство 200 хранения файлов источника звука для сохранения исходного файла 201 источника звука в WAV-формате на 128 кбит/с, обработанного файла 202 источника звука (для GSM), созданного посредством обработки исходного файла 201 источника звука, и обработанного файла 203 источника звука (для cdma), созданного посредством обработки исходного файла источника звука, и устройство 300 воспроизведения источника звука (устройство мелодий набора номера).

Обработанные файлы 202 и 203 источника звука, соответствующие надлежащим типам кодеков, создаются посредством обработки исходного файла источника звука (базового файла источника звука) с помощью алгоритма, созданного согласно настоящему изобретению. Созданные обработанные файлы источника звука сохраняются в устройстве 200 хранения файлов источника звука как база данных источника звука. Этот способ обработки является сутью настоящего изобретения.

Фиг.2 иллюстрирует случай прослушивания музыки при услуге мелодий набора номера. В частности, когда устройство 300 воспроизведения источника звука (устройство мелодий набора номера) принимает стартовый сигнал IAM (начального адресного сообщения), указывающий запрос на воспроизведение музыки, оно определяет тип кодека, используемого вызывающим абонентом, на основе информации вызывающего абонента в стартовом сигнале, выбирает и соединяет файл источника звука, обработанный для соответствующего кодека (один из обработанных файлов 202 и 203 источника звука). В это время обработанный файл источника звука отправляется как PCM-сигнал (импульсно-кодовой модуляции) µ-типа или PCM-сигнал А-типа при 64 кбит/с посредством устройства 300 воспроизведения источника звука.

Далее описывается операция соединения с улучшением качества звука в устройстве 20 предоставления источника звука, проиллюстрированном на фиг.2.

На фиг.2, когда запрос на воспроизведение музыки предоставляется посредством стартового сигнала IAM, устройство 20 предоставления источника звука определяет тип кодека вызывающего терминала 105 на основе информации вызывающего абонента, включенной в стартовый сигнал IAM, и воспроизводит музыку источника звука, обработанного для соответствующего кодека (один из обработанных файлов 202 и 203 источника звука). Если звуковые источники не подготовлены для соответствующего кодека, то устройство 20 предоставления источника звука воспроизводит музыку исходного источника звука (исходный файл 201 источника звука).

Обработанные файлы 202 и 203 источника звука для воспроизведения создаются на основе исходного источника звука исходного файла 201 источника звука. В это время необходимо взаимодействовать с кодеками сотовых телефонов. Краткий алгоритм обработки для аудиокодека 106 сотового телефона 105 (GSM-терминала) следующий.

Во-первых, обработанный файл 202 источника звука (для GSM) для воспроизведения (см. (B) на фиг.3), который создан на основе исходного источника звука (см. (A) на фиг.3) исходного файла 201 источника звука, описывается со ссылкой на фиг.3. В отношении исходного источника звука на (A) фиг.3, кадр, который, как определено, является шумом N, и два кадра сразу после шумового кадра (всего три кадра) из 20-миллисекундных аудиокадров принудительно заменяются на нули, как показано посредством "SI" в (B) фиг.3 (устранение шума, срезание).

Алгоритм обработки для выполнения вышеописанного процесса поясняется со ссылкой на фиг.4.

1. Базовый источник звука, представляющий музыку, вводится (этап S0 на фиг.4). Качество звука интенсивно ухудшается в части музыки, имеющей низкую громкость (части, имеющей небольшую амплитуду). Соответственно, расширение (регулировка усиления) выполняется для части, имеющей небольшую амплитуду (этап S1 на фиг.4).

Причины, по которым качество звука интенсивно ухудшается, когда музыка имеет низкую громкость, заключаются в следующем.

Алгоритм регулировки усиления имеет назначения усиления энергии сигналов, чтобы снизить количество срезаний, выполняемых в процессе срезания, описанном в нижеприведенном пункте 4). Фиг.5 иллюстрирует сравнение количества выполняемых принудительных отсечек посредством регулировки усиления. Ссылаясь на фиг.5, если абсолютное значение качества звука (pvad) близко к пороговому значению шума (thvad), то индекс оценки шума использует очень короткое время, чтобы стартовать с минимального значения, постепенно возрастать и в итоге достичь значения, которое считается шумом. Согласно алгоритму идентификации голоса (VAD), сигнал определяется как шум, когда пороговое значение шума (thvad) становится выше интенсивности звука (pvad). Если абсолютное значение интенсивности звука (pvad) небольшое, как показано в (1) на фиг.5, то пороговое значение шума (thvad) достигает интенсивности звука (pvad) моментально. Следовательно, необходимо часто выполнять принудительные отсечки шумовых кадров. Если абсолютное значение интенсивности звука (pvad) высокое, как показано в (2) на фиг.5, то пороговое значение шума (thvad) использует больше времени, чтобы достичь значения, которое считается шумом, после того как выполнена принудительная отсечка. Соответственно, количество принудительных отсечек снижается.

2. Введенный базовый источник звука делится на кадры (160 выборок) по 20 мс, которые являются единицей кодирования в кодеке (106 на фиг.2), (этап S2 на фиг.4).

3. Различение между шумом и речью (VAD, опознавание активности речи) в кодеке 106 выполняется следующим образом. Коэффициент интенсивности звука (pvad) и пороговое значение шума (thvad) вычисляются для каждого кадра (этап S3 на фиг.4). Если коэффициент интенсивности звука (pvad) превышает пороговое значение (thvad), то определяется, что кадр является звуковым кадром (этап S4 на фиг.4).

4. Качество звука музыки может быть улучшено посредством изменения логики оценки шума. Тем не менее, фоновые шумы не могут быть удалены. Таким образом, качество звука обычного разговора снижается. Технические характеристики 106 не могут быть изменены просто для цели предоставления музыки. Следовательно, согласно настоящему изобретению, ухудшение качества звука предотвращается посредством обработки файла источника звука.

Кадр, в котором интенсивность звука меньше, чем пороговое значение шума, определяется как шумовой кадр. Следовательно, интенсивность звука (pvad) должна быть выше порогового значения шума (thvad), чтобы не допустить опознавания текущего кадра как шумового кадра. Чтобы интенсивность звука была постоянно выше порогового значения шума, следующая операция выполняется. Часть, в которой пороговое значение шума выше интенсивности звука, находится посредством моделирующего GSM-устройства. Пороговое значение принудительно минимизируется в найденной части, с тем чтобы интенсивность звука была выше порогового значения шума. В это время, чтобы минимизировать пороговое значение шума, энергия входного сигнала должна быть принудительно задана равной нулю в соответствующем входном кадре, когда пороговое значение шума обновляется в VAD. Это может быть достигнуто посредством принудительного задания сигнала равным нулю. Этот процесс упоминается как процесс срезания.

5. Для кадра, для которого определено, что он является шумом, когда источник звука не обработан, всего три кадра, включая этот кадр (шумовой кадр), и два кадра сразу после шумового кадра, принудительно заменяются нулем (устраняется шум). Пороговое значение для оценки шума может быть снижено посредством замены трех последовательных кадров на нуль (этап S5 на фиг.4). Файл источника звука, в котором три последовательных кадра заменены нулем, выводится как обработанный файл источника звука для GSM (202 на фиг.2) в устройство хранения файлов (200 на фиг.2) (этап S6 на фиг.4).

Далее описываются причины, по которым пороговое значение оценки может быть снижено посредством принудительной замены (устранения шума) соответствующего кадра (шумового кадра) и двух кадров сразу после шумового кадра нулем.

Согласно алгоритму в кодеке (106 на фиг.2), используемом в GSM, пороговое значение шума сильно зависит от энергии кадра. Следовательно, пороговое значение шума может быть уменьшено посредством задания входного сигнала равным нулю (энергия=0).

Далее описывается число кадров, эффективное для снижения порогового значения посредством замены (устранения шума) сигнала нулем.

Согласно алгоритму, используемому для вычисления порогового значения шума в GSM, пороговое значение шума не понижается до минимального значения при одном бесшумном кадре или двух бесшумных кадрах. Пороговое значение шума может быть снижено до минимального значения посредством подавления трех или более последовательных кадров.

Когда четыре или более кадров подавлены, звук щелчка от мгновенного прерывания может быть слышен во время воспроизведения. Качество звука может быть улучшено в любом случае из двух бесшумных кадров и четырех бесшумных кадров. Качество звука может быть улучшено в наибольшей степени в случае трех бесшумных кадров. Когда число кадров, последовательно подавленных, представлено как N (положительное целое число), качество звука может быть улучшено даже в случае, если N - это положительное целое число, не равное трем. Тем не менее, когда N равно трем, оптимальные эффекты улучшения могут быть достигнуты.

6. Посредством снижения порогового значения шума (thvad) входной сигнал трактуется как звук. Следовательно, ухудшение качества звука может быть снижено.

Фиг.6 и 7 иллюстрируют изменения интенсивности звука (pvad) и порогового значения шума (thvad) файла источника звука без улучшения (файл 100 источника звука на фиг.1) и файла источника звука с улучшением (файл 202 источника звука на фиг.2). На фиг.6 (без улучшения), поскольку пороговое значение шума (thvad) большое, много кадров определено как шум. На фиг.7 (с улучшением), поскольку пороговое значение шума снижено посредством принудительных отсечек входных сигналов, число кадров, которые, как определено, являются шумом, существенно уменьшается.

7. Даже если пороговое значение шума уменьшено, оно постепенно возрастает при последующих вводах. Посредством выполнения расширения (регулировки усиления) для части, имеющей небольшую амплитуду, как описано в пункте 1), период времени, в течение которого пороговое значение шума достигает значения, которое считается шумом, может быть увеличен. Как результат, число принудительно отсекаемых кадров может быть снижено.

Таким образом, согласно настоящему изобретению, файл 202 источника звука, обработанный так, чтобы соответствовать кодеку 106, выбирается и подключается. Следовательно, можно прослушивать музыку с меньшим ухудшением качества звука.

Далее описываются результаты оценки улучшения качества звука.

1. Оценка с помощью моделирующего устройства

Двадцать видов источников звука подготовлено для оценки улучшения качества звука. Результаты оценки перечислены ниже в таблице 2.

Таблица 2 Результаты оценки с помощью моделирующего GSM-устройства
Номер музыки	Общее число кадров	Число шумовых кадров без улучшения	Число шумовых кадров с улучшением	Производительность улучшения (количественное снижение)
1	2000	211	0	211
2	2043	373	0	373
3	1980	192	21	171
4	2022	35	3	32
5	2016	14	0	14
6	1998	20	7	13
7	2004	971	20	951
8	2002	105	21	84
9	2005	663	9	654
10	2004	354	22	332
11	2003	171	0	171
12	2003	1168	15	1153
13	2005	172	10	162
14	2022	0	0	0
15	1959	886	8	878
16	2004	116	5	111
17	1980	1050	22	1028
18	2011	58	7	51
19	2004	896	15	881
20	2004	94	5	89

Число шумовых кадров, приведенное выше, измерено для звуковых источников без улучшения и звуковых источников с улучшением посредством использования моделирующего GSM-устройства.

Число шумовых кадров и отношение уменьшения шумовых кадров вследствие улучшения качества звука согласно настоящему изобретению варьируется в зависимости от музыки. Число шумовых кадров без улучшения является небольшим для музыки, главным образом состоящей из песни, или музыки, состоящей исключительно из звука скрипки. В частности, нет кадров, определенных в музыке номер 14 как шумовые кадры с начала музыки, так что музыка без улучшения такая же, как и музыка с улучшением. Число шумовых кадров увеличилось для композиций с фортепьяно, композиций с оркестром и динамичной музыки, имеющей быстрые вариации. Улучшение качества звука согласно настоящему изобретению было очень эффективным в этих композициях.

2. Субъективная оценка для действующего терминала (MOS)

Части музыки до и после обработки источника звука воспроизводились посредством действующей сотовой телефонной сети посредством GSM-терминала, сравнивались друг с другом и оценивались. В случае источника звука без улучшения клокочущий шум примешивался, когда одна фраза заканчивалась в музыке. Тем не менее, шумы практически не примешивались в случае улучшенного источника звука. Таким образом, оценено, что качество звука может быть улучшено.

Степень улучшения качества звука согласно настоящему изобретению отличается в зависимости от музыки. Музыка с пением и струнная музыка имеют меньшие слышимые шумы даже без улучшения. Число слышимых шумов существенно снизилось в музыке с фортепьяно и музыке, имеющей значительные вариации.

Промышленная применимость

Настоящее изобретение может быть широко использовано в распространенных услугах прослушивания музыки посредством сотового телефона.

В частности, в услуге мелодий набора номера и конечные пользователи, и поставщики звуковых источников имеют запрашиваемое улучшение качества звука. Конечные пользователи задавали следующий запрос на улучшение качества звука: "Мы хотим прослушивать музыку, имеющую высокое качество". Поставщики содержимого задавали следующие потребности: "Мы хотим передавать музыку, которая должна воспроизводиться с высоким качеством. Как результат, мы хотим увеличить продажи в предоставлении содержимого. Если качество звука низкое, мы не можем увеличить продажи в предоставлении содержимого". Настоящее изобретение позволяет удовлетворить эти запросы и потребности.

1. Устройство предоставления источника звука для предоставления услуги воспроизведения музыки посредством портативного терминала, отличающееся тем, что оно содержит
устройство хранения файлов источника звука для предварительного сохранения множества типов обработанных файлов источника звука, создаваемых посредством обработки исходного источника звука музыки, так чтобы уменьшить ухудшение качества звука, согласно характеристикам множества типов кодеков; и
устройство воспроизведения источника звука для определения типа кодека портативного терминала на основе информации вызывающего абонента, включенной в стартовый сигнал, когда оно принимает стартовый сигнал, указывающий запрос на воспроизведение, воспроизведения одного обработанного файла источника звука, соответствующего определенному типу кодека, выборочно из множества типов обработанных файлов источника звука, и предоставления одного обработанного файла источника звука в портативный терминал, с тем чтобы воспроизводить музыку посредством портативного терминала,
при этом устройство воспроизведения источника звука выбирает, соединяет и отправляет файл источника звука, обработанный для соответствующего кодека.

2. Устройство предоставления источника звука по п.1, отличающееся тем, что
любой из множества типов обработанных файлов источника звука создан посредством обработки исходного источника звука, с тем чтобы подавить, по меньшей мере, один кадр, который считается шумом, если исходный источник звука не обработан, из аудиокадров в исходном источнике звука.

3. Устройство предоставления источника звука по п.2, отличающееся тем, что
любой из множества типов обработанных файлов источника звука создан посредством обработки исходного источника звука, с тем, чтобы подавить множество последовательных кадров, начиная с кадра, который считается шумом, если исходный источник звука не обработан, из аудиокадров в исходном источнике звука.

4. Устройство предоставления источника звука по п.3, отличающееся тем, что
любой из множества типов обработанных файлов источника звука создан посредством обработки исходного источника звука, с тем, чтобы подавить три последовательных кадра, начиная с кадра, который считается шумом, если исходный источник звука не обработан, из аудиокадров в исходном источнике звука.

5. Способ предоставления источника звука для предоставления услуги воспроизведения музыки посредством портативного терминала, отличающийся тем, что он содержит
этап, на котором предварительно сохраняют множество типов обработанных файлов источника звука, созданных посредством обработки исходного источника звука музыки, так чтобы уменьшить ухудшение качества звука, согласно характеристикам множества типов кодеков;
этап определения типа, на котором определяют тип кодека портативного терминала на основе информации вызывающего абонента, включенной в стартовый сигнал, при приеме стартового сигнала, указывающего запрос на воспроизведение; и
этап, на котором воспроизводят один обработанный файл источника звука, соответствующий определенному типу кодека, выборочно из множества типов обработанных файлов источника звука, и предоставляют один обработанный файл источника звука в портативный терминал, с тем, чтобы воспроизводить музыку посредством портативного терминала,
при этом файл источника звука, обработанный для соответствующего кодека, выбирают, соединяют и отправляют посредством устройства воспроизведения источника звука.

6. Способ предоставления источника звука по п.5, отличающийся тем, что
любой из множества типов обработанных файлов источника звука создают посредством обработки исходного источника звука, с тем, чтобы подавить, по меньшей мере, один кадр, который считается шумом, если исходный источник звука не обработан, из аудиокадров в исходном источнике звука.

7. Способ предоставления источника звука по п.6, отличающийся тем, что
любой из множества типов обработанных файлов источника звука создают посредством обработки исходного источника звука, с тем, чтобы подавить множество последовательных кадров, начиная с кадра, который считается шумом, если исходный источник звука не обработан, из аудиокадров в исходном источнике звука.

8. Способ предоставления источника звука по п.7, отличающийся тем, что
любой из множества типов обработанных файлов источника звука создают посредством обработки исходного источника звука, с тем, чтобы подавить три последовательных кадра, начиная с кадра, который считается шумом, если исходный источник звука не обработан, из аудиокадров в исходном источнике звука.

9. Устройство предоставления источника звука для предоставления услуги воспроизведения музыки посредством портативного терминала, отличающееся тем, что оно содержит
устройство хранения файлов источника звука для предварительного сохранения обработанного файла источника звука, созданного посредством обработки исходного источника звука музыки, так чтобы уменьшить ухудшение качества звука, согласно характеристикам кодека портативного терминала; и
устройство воспроизведения источника звука для определения типа кодека портативного терминала на основе информации вызывающего абонента, включенной в стартовый сигнал, когда оно принимает стартовый сигнал, указывающий запрос на воспроизведение, воспроизведения обработанного файла источника звука, когда устройство воспроизведения источника звука принимает стартовый сигнал, указывающий запрос на воспроизведение, и предоставления обработанного файла источника звука в портативный терминал, с тем, чтобы воспроизводить музыку посредством портативного терминала,
при этом обработанный файл источника звука создан посредством обработки исходного источника звука, с тем, чтобы подавить, по меньшей мере, один кадр, который считается шумом, если исходный источник звука не обработан, из аудиокадров в исходном источнике звука,
при этом устройство воспроизведения источника звука выбирает, соединяет и отправляет файл источника звука, обработанный для соответствующего кодека.

10. Устройство предоставления источника звука по п.9, отличающееся тем, что
обработанный файл источника звука создан посредством обработки исходного источника звука, с тем, чтобы подавить множество последовательных кадров, начиная с кадра, который считается шумом, если исходный источник звука не обработан, из аудиокадров в исходном источнике звука.

11. Устройство предоставления источника звука по п.10, отличающееся тем, что
обработанный файл источника звука создан посредством обработки исходного источника звука, с тем, чтобы подавить три последовательных кадра, начиная с кадра, который считается шумом, если исходный источник звука не обработан, из аудиокадров в исходном источнике звука.

12. Способ предоставления источника звука для предоставления услуги воспроизведения музыки посредством портативного терминала, отличающийся тем, что он содержит
этап, на котором предварительно сохраняют обработанный файл источника звука, созданный посредством обработки исходного источника звука музыки, так чтобы уменьшить ухудшение качества звука, согласно характеристикам кодека портативного терминала; и
этап, на котором определяют тип кодека портативного терминала на основе информации вызывающего абонента, включенной в стартовый сигнал, при приеме стартового сигнала, указывающего запрос на воспроизведение;
этап, на котором воспроизводят обработанный файл источника звука при приеме стартового сигнала, указывающего запрос на воспроизведение, и предоставляют обработанный файл источника звука в портативный терминал, с тем чтобы воспроизводить музыку посредством портативного терминала,
при этом обработанный файл источника звука создают посредством обработки исходного источника звука, с тем, чтобы подавить, по меньшей мере, один кадр, который считается шумом, если исходный источник звука не обработан, из аудиокадров в исходном источнике звука,
при этом файл источника звука, обработанный для соответствующего кодека, выбирают, соединяют и отправляют посредством устройства воспроизведения источника звука.

13. Способ предоставления источника звука по п.12, отличающийся тем, что
обработанный файл источника звука создают посредством обработки исходного источника звука, с тем, чтобы подавить множество последовательных кадров, начиная с кадра, который считается шумом, если исходный источник звука не обработан, из аудиокадров в исходном источнике звука.

14. Способ предоставления источника звука по п.13, отличающийся тем, что
обработанный файл источника звука создают посредством обработки исходного источника звука, с тем, чтобы подавить три последовательных кадра, начиная с кадра, который считается шумом, если исходный источник звука не обработан, из аудиокадров в исходном источнике звука.

Изобретение относится к кодированию звуковых сигналов и последующему синтезу слуховых пространств из закодированных звуковых данных. .

Способ и устройство для декодирования параметрического закодированного звукового сигнала // 2382485

Изобретение относится к декодированию звукового сигнала и, более конкретно, к декодированию параметрических закодированных звуковых сигналов. .

Многоканальный кодер // 2382419

Изобретение относится к многоканальным кодерам, например к многоканальным звуковым кодерам, использующим параметрическое описание пространственного звука. .

Способ совмещения параметрического многоканального аудиокодирования с матричным многоканальным кодированием объемного звучания // 2382418

Изобретение относится к многоканальному аудиокодированию и передаче и, в частности, к способам кодирования многоканального аудиосигнала, полностью обратно совместимого со стереоустройствами и форматами.

Способ осуществления эквалайзера в декодере аудиосигнала и устройство для его осуществления // 2381617

Изобретение относится к обработке аудиосигнала и, более конкретно, к способу осуществления эквалайзера в устройстве, предназначенном для обработки аудиосигнала. .

Стереофонически совместимое кодирование многоканального звука // 2381570

Изобретение относится к кодированию многоканального звука, и в частности к генерированию и использованию параметрического представления многоканального звукового сигнала, которое обратно совместимо со средствами воспроизведения сигнала параметрического стерео.

Способ и устройство масштабирования сигнала по времени // 2381569

Изобретение относится к способу и устройству масштабирования сигнала по времени. .

Функционирование вокодеров без последовательного соединения между несовместимыми системами связи // 2380860

Способ и устройство для декодирования аудиосигнала // 2380767

Изобретение относится к обработке аудиосигналов, более конкретно к способу и устройству для декодирования аудиосигнала. .

Адаптивное остаточное аудиокодирование // 2380766

Изобретение относится к кодированию и декодированию аудиосигналов и, в частности, к эффективному высококачественному кодированию пары аудиоканалов. .

Способ и устройство для кодирования и декодирования аудиосигналов // 2383941

Изобретение относится к обработке аудиосигнала и, более конкретно, к способу и устройству для кодирования и декодирования аудиосигналов

Способ и устройство для декодирования аудиосигнала // 2383942

Изобретение относится к обработке аудиосигналов, а более конкретно к устройству и способу декодирования аудиосигнала

Кодирование звуковых сигналов // 2383943

Масштабируемый аудиокодер без потерь и авторское инструментальное средство // 2387022

Изобретение относится к аудиокодекам без потерь, более конкретно - к масштабируемому аудиокодеку без потерь и авторскому инструментальному средству

Многоканальный аудиокодер без потерь // 2387023

Изобретение относится к аудиокодекам без потерь, более конкретно к многоканальным аудиокодекам без потерь

Кодер, декодер, способ кодирования и способ декодирования // 2387024

Изобретение относится к устройству кодирования, устройству декодирования, способу кодирования и способу декодирования

Способ и устройство для векторного квантования спектрального представления огибающей // 2387025

Изобретение относится к обработке речевых сигналов

Временное и пространственное генерирование многоканальных аудиосигналов // 2388068

Изобретение относится к кодированию многоканальных аудиосигналов

Снижение разреженности в кодированных речевых сигналах // 2388069

Изобретение относится к кодированию речи и более конкретно к проблеме разреженности в кодированных речевых сигналах

Способы и устройства для введения низкочастотных предыскажений в ходе сжатия звука на основе acelp/tcx // 2389085

Изобретение относится к способу введения низкочастотных предыскажений в спектр звукового сигнала, преобразуемого в частотной области и содержащего коэффициенты преобразования, сгруппированные в ряд блоков, в котором вычисляется максимальная интенсивность для одного блока и определяется индекс позиции блока с максимальной интенсивностью, рассчитывается коэффициент для каждого блока, имеющего индекс позиции меньше индекса позиции блока с максимальной интенсивностью, и для каждого блока определяется усиление из коэффициента и применяется к коэффициентам преобразования блока