Генератор водяного знака, декодер водяного знака, способ генерации сигнала водяного знака на основе данных двоичного сообщения, способ формирования данных двоичного сообщения на основе сигнала с водяным знаком и компьютерная программа с использованием дифференциального кодирования

Авторы патента:

ЗИТЗМАНН Реинхард (DE)

ВАБНИК Стефан (DE)

ДЕЛ ГАЛДО Джованни (DE)

БОРСУМ Жулиан (DE)

ПИКЕЛ Йорг (DE)

ГРЕЕВЕНБОШ Берт (NL)

ЭБЕРЛЕИН Эрнст (DE)

ГРИЛЛ Бернард (DE)

БРЕИЛИНГ Марко (DE)

КРАГЕЛОХ Стефан (DE)

БЛИЕМ Тобиас (DE)

G10L19/018 - Техника анализа-синтеза речи для уменьшения избыточности, например в вокодерах ; кодирование или декодирование речи

Владельцы патента RU 2586844:

Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. (DE)

Изобретение относится к средствам генерирования, кодирования и декодирования водяного знака. Технический результат заключается в повышении надежности в случае воздействия на сигнал водяного знака доплеровского сдвига частоты. Генератор водяного знака для выработки, исходя из данных двоичного сообщения, сигнала цифрового водяного знака, содержит процессор информации, формирующий на основе информационных единиц данных двоичного сообщения первое время-частотное представление, где значения отображают данные двоичного сообщения; дифференциальный кодер, формирующий на базе первого время-частотного представления второе время-частотное представление, содержащее множество значений, разность двух из которых выражает соответствующее значение первого время-частотного представления, для выполнения дифференциального (разностного) кодирования значений первого время-частотного представления. Генератор водяного знака также содержит провайдер сигнала водяного знака, сконфигурированный для предоставления сигнала водяного знакана основе второго время-частотного представления. 15 н. и 8 з.п. ф-лы, 43 ил.

Область техники

Изобретение относится к генератору водяных знаков, обеспечивающему на выходе сигнал водяного знака на основе данных двоичного сообщения. Кроме того, заявляемое изобретение относится к декодеру водяных знаков, формирующему на выходе данные двоичного сообщения на основе маркированного водяным знаком сигнала. Кроме того, представляемое изобретение относится к способу генерации сигнала водяного знака на основе данных двоичного сообщения. Кроме того, настоящее изобретение относится к способу формирования данных двоичного сообщения на основе маркированного водяным знаком сигнала. В дополнение к этому, заявляемое изобретение связано с соответствующими компьютерными программами.

Ряд предлагаемых конструктивных решений изобретения относится к простой и надежной системе маркирования аудиоконтента цифровыми водяными знаками.

Предшествующий уровень техники

Во многих технических приложениях существует необходимость введения дополнительной информации в данные или в сигнал, представляющий полезные данные, или "основные данные", такие как, например, аудиосигнал, видеосигнал, графика, показания измерений и тому подобное. Часто требуется, чтобы подобного рода дополнительная информация, привязываемая к основным данным (в частности, к аудиоданным, видеоданным, к данным изображения, данным измерений, к текстовой информации и прочее), вводилась таким образом, чтобы она была незаметной для пользователя этими данными. Более того, в ряде случаев желательно, чтобы присоединенная информация не могла быть удалена из основных данных (тех же аудиоданных, видеоданных, данных изображения, данных измерения и так далее).

В особенности это относится к приложениям, где необходима электронная защита авторских прав. Более того, иногда введение в полезные данные важной дополнительной, не воспринимаемой органами чувств, сопутствующей информации просто необходимо. Таким случаем является, например, включение в аудиоконтент служебной информации, содержащей сведения об источнике предлагаемой фонограммы, ее содержимом, о правах, которыми обременен данный аудиоконтент и т.п.

Концепция внедрения дополнительных сведений в полезные данные или в "основные данные" получила название "watermarking", то есть буквально - "нанесение водяных знаков" (маркировка водяными знаками / введение водяного знака). Обсуждение в специализированной литературе методик защиты водяными знаками затрагивает большое число видов полезной информации, как то - фонограммы, видеоматериалы, изображения, тексты и тому подобное.

Дальше дан ряд ссылок на публикации концепций применения цифровых водяных знаков. Сюда относится также широкий спектр пособий, руководств и иных изданий, подробно рассматривающих вопросы электронной защиты водяными знаками.

DE 19640814 С2 описывает метод кодирования, при котором в аудиосигнал вводят незвуковой сигнал данных, и метод декодирования сигнала данных, сопутствующего аудиосигналу в незвуковой форме. Метод кодирования для введения незвукового сигнала данных в звуковой сигнал состоит в преобразовании звукового сигнала в спектральное представление. Данный метод кодирования также включает в себя определение порога маскирования аудиосигнала и подачу псевдошумового сигнала. Этот метод кодирования, кроме того, включает в себя введение сигнала данных и умножение псевдошумового сигнала на сигнал данных с получением сигнала данных с частотным расширением. Метод кодирования наряду с этим включает в себя взвешивание сигнала данных расширения с порогом маскирования и перекрыванием аудиосигнала и сигнал взвешенных данных.

В дополнение к этому в WO 93/07689 описан способ и устройство автоматической идентификации программы, передаваемой радиостанцией или телевизионным каналом или записанной на носителе, путем добавления к звуковому сигналу программы неслышимого кодированного сообщения, идентифицирующего канал телевещания или радиостанцию, программу и/или точную дату. При реализации согласно указанному документу звуковой сигнал передают через аналого-цифровой преобразователь на процессор, предусматривающий возможность дробления частотных составляющих и изменения энергии некоторых частотных составляющих на расчетную величину с формированием кодированного сигнала идентификации. Выход процессора соединен через цифро-аналоговый преобразователь со звуковым выходом для передачи звукового сигнала в эфир или для записи фонограммы. В другом варианте решения по рассматриваемому документу применяют аналоговую полосу пропускания для выделения частотной полосы звукового сигнала, в которой энергия может быть изменена для кодирования звукового сигнала.

В US 5450490 описано устройство и способы введения кода, имеющего, по меньшей мере, одну кодовую частотную составляющую в аудиосигнале. Разные частотные составляющие аудиосигнала оцениваются на возможность маскировать кодовую частотную составляющую для человеческого слуха, и на основании этих оценок задается амплитуда кодовой частотной составляющей. Также дано описание способов и устройства распознавания кода в закодированном аудиосигнале. Кодовую частотную составляющую кодированного аудиосигнала распознают, основываясь на ожидаемой кодовой амплитуде или на амплитуде помехи в диапазоне звуковых частот, включающем в себя частоту кодирующей составляющей.

В WO 94/11989 рассмотрен способ и устройство кодирования/декодирования транслируемых или записанных звуковых фрагментов и мониторинга расположения их слушателей. Описаны способы и устройство кодирования и декодирования информации в составе радиопередач или в составе записанных сигналов звукового фрагмента. В схемотехнической версии, описанной в документе, система мониторирования аудитории кодирует идентифицирующую информацию как составляющую аудиосигнала радиопередачи или фрагмента фонограммы с использованием кодирования расширенного спектра (широкополосное кодирование). Устройство мониторинга принимает акустически воспроизведенную версию радиопередачи или записанного сигнала через микрофон, декодирует идентифицирующую информацию составляющей аудиосигнала независимо от наличия окружающего фонового шума и вносит эту информацию в память, автоматически ведя на данного участника аудитории дневник (журнал), который позже загружается в централизованное системное устройство. Другое устройство мониторинга декодирует дополнительную информацию сигнала радиопередачи, соотнесенный со сведениями дневника аудитории в центральном системном устройстве. Этот монитор может одновременно отправлять данные на централизованное системное устройство, используя телефонную линию модемной связи, и принимать данные от централизованного системного устройства через сигнал, закодированный с использованием технологии расширенного спектра и модулированный по сигналу радиопередачи от третьего лица.

WO 95/27349 раскрывает устройство и способы введения кодов в аудиосигналы и декодирования. Описаны устройство и способы введения кода, имеющего, по меньшей мере, одну кодирующую частотную составляющую в аудиосигнале. Выполняется оценивание способности разных частотных составляющих аудиосигнала маскировать кодовую частотную составляющую для слуха человека, и на базе результатов такого оценивания каждой из кодирующих частотных составляющих присваивается амплитуда. Также дано описание способов и устройства распознавания кода в закодированном аудиосигнале. Кодовую частотную составляющую кодированного аудиосигнала распознают, основываясь на ожидаемой кодовой амплитуде или на амплитуде помехи в диапазоне звуковых частот, включающем в себя частоту кодирующей составляющей.

Между тем, в известных системах нанесения цифровых водяных знаков возникают проблемы надежности, когда на маркированный водяным знаком сигнал влияет допплеровский сдвиг в результате, например, движения устройства, принимающего сигнал с водяным знаком, или в случае рассогласования гетеродинов на стороне генератора водяного знака и на стороне декодера водяного знака.

В контексте сложившейся ситуации задачей заявляемого изобретения является создание концепции нанесения цифровых водяных знаков и концепции распознавания водяного знака, которые способствовали бы повышению надежности в случаях воздействия на сигнал водяного знака доплеровского сдвига частоты и частотных отклонений между гетеродинами генератора водяного знака и декодера водяного знака.

Краткое описание изобретения

Эта задача решается за счет применения генератора водяного знака, декодера водяного знака, способа формирования данных двоичного сообщения, способа формирования данных двоичного сообщения на основе сигнала с водяным знаком и компьютерной программы.

Реализация заявляемого изобретения включает в себя создание генератора электронных водяных знаков, выполненного с возможностью генерации сигнала водяного знака на основе данных двоичного сообщения. Генератор водяного знака включает в свою конструкцию процессор информации, который на основе информационно значимых единиц (например, битов) данных двоичного сообщения формирует первое представление во время-частотной области (время-частотное представление), значения которого отображают данные двоичного сообщения. Генератор водяного знака также включает в свою конструкцию дифференциальный (разностный) кодер, который формирует второе представление в время-частотной области на основании первого время-частотного представления таким образом, что второе время-частотное представление содержит множество значений, в котором разность между двумя значениями второго время-частотного представления является соответствующим значением первого время-частотного представления для кодирования разности значений первого представления во время-частотной области. Кроме того, генератор водяного знака включает в свою конструкцию «провайдер» сигнала водяного знака (устройство вывода сигнала водяного знака), генерирующий сигнал водяного знака на основе второго представления во время-частотной области.

Основа концепции предлагаемого изобретения заключается в том, что устойчивость сигнала водяного знака, например, к эффекту Доплера может быть обеспечена особенно надежно, если смежные значения время-частотной области (например, соседних частотных полос или межбитовых интервалов) будут закодированы таким образом, что у таких смежных составляющих сигнала разность характеристик, выраженных значениями второго время-частотного представления, однозначно коррелировала с соответствующим значением первого представления во время-частотной области. Другими словами, дифференциальное (разностное) кодирование в время-частотной области обеспечивает выход устойчивого сигнала, маркированного водяным знаком, например, когда генерирован аудиосигнал время-частотной области, аудиоконтент которого, маркированный водяным знаком, определен вторым представлением во время-частотной области.

Таким образом, повышенная устойчивость к движению и частотному рассогласованию гетеродинов достигается с помощью дифференциальной модуляции. Действительно, эффект Доплера, вызываемый, в частности, движением преобразователя сигнала, генерирующего аудиосигнал с водяным знаком, относительно декодера этого водяного знака, и частотные рассогласования приводят к ротации модуляционной констелляции, например, стереометрии двоичной фазовой манипуляции (ДФМн / BPSK). Вредные воздействия доплеровского сдвига или частотного рассогласования могут быть снижены или полностью устранены с помощью дифференциального кодирования. Таким образом, дифференциальное (разностное) кодирование дает то эффект, что сигнал с водяным знаком, сформированный на базе второго время-частотного представления, нечувствителен к ротации битов в комплексной плоскости.

В предпочтительном варианте процессор информации реализован с возможностью формирования первого представление во время-частотной области таким образом, что значения первого время-частотного представления отображают данные двоичного сообщения в форме двоичной комбинации. В этом случае дифференциальный кодер формирует производное второе представление во время-частотной области таким образом, что между двумя последовательными значениями второго время-частотного представления есть фазовый переход, если соответствующее значение первого время-частотного представления принимает первое значение, и таким образом, что между последовательными значениями второго время-частотного представления фазового перехода нет, если соответствующее значение первого представления во время-частотной области принимает второе значение, отличное от первого значения.

В предпочтительном варианте устройство вывода сигнала водяного знака ("провайдер" сигнала водяного знака)выполнено с возможностью формирования аудиосигнала на базе второго время-частотного представления таким образом, что частотная компонента водяного знака сигнала водяного знака содержит ступенчатый или плавный фазовый переход в качестве отклика на первое значение первого представления во время-частотной области, и таким образом, что частотная компонента водяного знака сигнала водяного знака содержит постоянную во времени фазу в качестве отклика на второе значение первого представления во время-частотной области, отличающегося от первого значения.

В предпочтительном исполнении устройство вывода сигнала водяного знака выводит первую форму сигнала, задающую форму бита, как отклик на первое значение второго время-частотного представления, и выводит вторую форму сигнала, задающую форму бита, как отклик на второе значение второго время-частотного представления. Провайдер сигнала водяного знака включает в сигнал водяного знака взвешенную или невзвешенную суперпозицию сдвинутых во времени модификаций одной и той же формы сигнала, формирующей бит, в ответ на наличие первого значения в первом время-частотном представлении и включает в сигнал с водяным знаком взвешенную или невзвешенную суперпозицию сдвинутых во времени модификаций первой формы сигнала, формирующей бит и второй формы сигнала, формирующей бит, в ответ на наличие второго, отличного от первого, значения в первом время-частотном представлении. Преимуществом такого варианта осуществления является простота определения различия между суммой (или суперпозицией) сдвинутых во времени модификаций одного и того же сигнала, задающего форму бита, от суммы (или суперпозиции) первого сигнала формирования бита и второго сигнала формирования бита, достаточно различающихся между собой. В силу того что следующие друг за другом сигналы формирования бита испытывают одинаковое или, по меньшей мере, приблизительно одинаковое воздействие канала, по которому передается сигнал с водяным знаком, это несложно учесть в значении первого время-частотного представления, так как прием двух идентичных (или почти идентичных) сигналов формирования бита позволяет сделать заключение, что значение первого время-частотного представления было первым (например, +1). Аналогичным образом, прием любых двух, существенно различающихся, сигналов формирования бита позволяет сделать вывод, что значение первого время-частотного представления было вторым (например, -1).

В предпочтительном варианте осуществления второй сигнал, задающий форму бита, является инверсией первого сигнала, формирующего бит. Это позволяет легко учитывать его в значении первого представления во время-частотной области с минимальными затратами на фильтрацию и/или корреляцию.

Предпочтительное конструктивное решение изобретения включает в себя декодер водяного знака, предназначенный для формирования данных двоичного сообщения в зависимости от сигнала с водяным знаком. Декодер водяного знака включает в свою схему блок формирования время-частотного представления, вырабатывающий первое представление сигнала с водяным знаком во время-частотной области. Декодер водяного знака также включает в свою схему дифференциальный декодер, предназначенный для выведения второго представления во время-частотной области из первого представления во время-частотной области таким образом, что значения второго время-частотного представления зависят от разностей фаз двух соответствующих (и, предпочтительно, смежных) значений первого время-частотного представления. Кроме того, декодер водяного знака включает в свою схему детектор синхронизации, предназначенный для извлечения данных синхронизации из второго время-частотного представления. Наряду с этим, декодер водяного знака включает в свою схему экстрактор водяного знака для извлечения данных двоичного сообщения из первого представления сигнала с водяным знаком во время-частотной области или из второго представления сигнала с водяным знаком во время-частотной области с использованием информации о синхронизации.

Другая аппаратная версия представленного изобретения также имеет в своем составе декодер водяного знака, предназначенный для формирования данных двоичного сообщения в зависимости от сигнала с водяным знаком. Этот декодер водяного знака включает в свою схему блок формирования время-частотного представления, вырабатывающий первое представление сигнала с водяным знаком во время-частотной области, и дифференциальный декодер. Дифференциальный декодер выполнен с возможностью формирования второго время-частотного представления на основе первого время-частотного представления таким образом, что значения второго время-частотного представления зависят от разностей фаз двух соответствующих значений первого время-частотного представления. Декодер водяного знака также включает в свою схему экстрактор водяного знака, предназначенный для извлечения данных двоичного сообщения из второго представления во время-частотной области.

Рассматриваемые технические решения по заявляемому изобретению базируются на заключении, что безотказность декодирования водяного знака может быть повышена за счет оценивания разности фаз смежных значений первого время-частотного представления, в котором отображены, например, амплитуды или энергия и фазы сигнала с водяным знаком в различных частотных диапазонах для множества временных интервалов. Установлено, что разности соседних (скажем, смежных по времени или по частоте) значений первого представления во время-частотной области, которое может быть построено на базе аудиосигнала с водяным знаком, например, с помощью банка фильтров или преобразования Фурье или МДКП, как правило, устойчивы к многим типичным искажениям канала, таким как достаточно медленные изменения в канале, доплеровский сдвиг частоты и тому подобное. В силу этого достигается надежность построения второго представления во время-частотной области, нечувствительного к изменениям в канале, по которому передается сигнал, маркированный водяным знаком. Следовательно, описанный выше декодер водяного знака обеспечивает очень высокий уровень надежности.

Предпочтительное конструктивное решение устройства формирования время-частотного представления характеризуется возможностью выведения для множества полос частот и для множества интервалов времени гибких битовых коэффициентов, описывающих амплитуду и фазу сигнала с водяным знаком в соответствующих частотных диапазонах и интервалах времени. Дифференциальный декодер реализован с возможностью вычисления значения второго время-частотного представления, связанного с данной полосой частот и данным отрезком времени, исходя из двух соответствующих значений первого представления во время-частотной области или из его предобработанной версии. Использование двух значений первого время-частотного представления для выведения одного значения второго время-частотного представления дает возможность рассчитать разности фаз двух значений первого представления во время-частотной области. В таких вычислениях могут быть задействованы как действительные, так и/или комплексные числа. Благодаря этому любые медленные изменения в канале, не оказывающие существенное воздействие на соседние значения первого время-частотного представления, могут быть приближенно компенсированы с помощью двух значений первого время-частотного представления, дающих производные значения второго время-частотного представления.

В предпочтительной компоновке декодер водяного знака включает в себя банк фильтров анализа для свертывания сигнала с водяным знаком, или производного от него сигнала понижающего микширования, с функцией формирования бита. В этом случае декодер водяного знака предусматривает временную дискретизацию результата свертки с получением дискретных значений времени первого время-частотного представления. Декодер водяного знака реализован с возможностью подстройки тактовой частоты, использованной при дискретизации результата свертки, по разрешению подмежбитового интервала в соответствии с данными синхронизации для приведения к максимальному значению отношения сигнал-шум и минимизации коэффициента взаимного влияния символов. Было определено, что выходной сигнал такого банка фильтров анализа применим в качестве первого представления во время-частотной области для дифференциального декодирования. Кроме того, было определено, что дифференциальное декодирование обеспечивает надлежащие результаты для первого представления во время-частотной области даже при наличии небольшого тактового рассогласования с результатом дискретизации после свертки.

В предпочтительном конструктивном решении дифференциальный декодер вырабатывает независимое второе представление во время-частотной области для каждой полосы частот, обеспечивая таким образом независимое вращение фаз сигнала с водяным знаком в разных полосах. Детектор синхронизации или декодер водяного знака совокупно обрабатывает ряд значений время-частотного представления фрагмента отдельного интервала времени, включающего в себя различные полосы частот, вырабатывая данные синхронизации или бит данных двоичного сообщения. Было подтверждено, что дифференциальное декодирование обеспечивает надлежащую совместную обработку значений второго время-частотного представления даже без применения корректора канала и даже независимо от параметров состояния канала. Таким образом, сама концепция изобретения обеспечивает ее особо эффективное техническое осуществление.

Заявляемое изобретение предусматривает включение в аппаратную конфигурацию портативного устройства распознавания водяного знака. Устройство распознавания водяного знака включает в себя микрофон, генерирующий электрический микрофонный сигнал, и декодер водяного знака, как рассматривалось выше. Декодер водяного знака принимает сигнал микрофона как сигнал с водяным знаком. На практике установлено, что применение относящегося к изобретению декодера водяного знака особенно выигрышно в таком портативном устройстве распознавания водяного знака, анализирующем уловленный микрофоном аудиосигнал, потому что этот декодер водяного знака наименее чувствителен к таким типичным искажениям канала, как, например, доплеровские сдвиги, нули передаточной функции и тому подобное.

К заявленному изобретению также относятся способ генерации сигнала водяного знака на основе данных двоичного сообщения и способ формирования данных двоичного сообщения в зависимости от маркированного водяным знаком сигнала. Изобретение также реализуется через компьютерные программы для осуществления названных способов.

Относящиеся к изобретению способы и компьютерные программы основаны на тех же концептуальных аспектах, что и описанное выше схемотехническое решение.

Краткое описание фигур

Далее, варианты технических решений в соответствии с предлагаемым изобретением будут описаны со ссылкой на прилагаемые фигуры, где на фиг.1 дана принципиальная блочная схема устройства ввода водяного знака согласно изобретению; на фиг.2 дана принципиальная блочная схема декодера водяных знаков согласно изобретению; на фиг.3 дана более подробная принципиальная блочная схема генератора водяных знаков согласно изобретению; на фиг.4 дана подробная принципиальная блочная схема модулятора как элемента схемотехники изобретения; на фиг.5 дана блок-схема рабочего цикла психоакустического процессора как элемента схемотехники изобретения; на фиг.6 дана блок-схема рабочего цикла процессора психоакустической модели как элемента схемотехники изобретения; на фиг.7 отображен график зависимости спектральной плотности мощности аудиосигнала на выходе блока 801 от частоты; на фиг.8 отображен график зависимости спектральной плотности мощности аудиосигнала на выходе блока 802 от частоты; на фиг.9 дана блок-схема расчета амплитуды; на фиг.10A показана принципиальная схема модулятора; на фиг.10B графически представлен пример распределения коэффициентов на время-частотной плоскости; на фиг.11A и 11B в принципиальных блочных схемах представлено альтернативное конструктивное решение модуля синхронизации; фиг.12A графически отображает задачу временного выравнивания водяного знака; фиг.12B графически отображает задачу идентификации начала сообщения; фиг.12C графически иллюстрирует построение временного соответствия последовательностей синхронизации в режиме синхронизации полного сообщения; фиг.12D графически иллюстрирует построение временного соответствия последовательностей синхронизации в режиме синхронизации неполного сообщения; на фиг.12E графически представлены входные данные модуля синхронизации; на фиг.12F графически представлена концепция идентификации точки синхронности; на фиг.12G дана принципиальная блочная схема коррелятора сигнатуры синхронизации (маркировки совпадения); фиг.13A графически иллюстрирует пример временной свертки; фиг.13B графически иллюстрирует пример поэлементного перемножения битов и последовательностей расширения; на фиг.13C представлен график сигнала на выходе коррелятора сигнатуры синхронизации после усреднения по времени; на фиг.13D представлен график сигнала на выходе коррелятора сигнатуры синхронизации после фильтрации с использованием функции автокорреляции сигнатуры синхронизации; на фиг.14 дана принципиальная блочная схема конструктивного решения экстрактора водяного знака в соответствии с изобретением; фиг.15 схематически отображает выбор части представления во время-частотной области в качестве кандидатного сообщения; на фиг.16 показана принципиальная блочная схема модуля анализа; на фиг.17A показана спектрограмма выходного сигнала коррелятора синхронизации; на фиг.17B схематически отображены декодированные сообщения; на фиг.17C графически отображено положение синхронизации, выделенное из сигнала с водяным знаком; на фиг.18A графически представлены полезная информация, полезная информация с конечной последовательностью Витерби, полезная информация в кодировке по Витерби и полезная нагрузка в кодировке по Витерби в закодированной с повторениями версии; на фиг.18B графически отображены поднесущие частоты, используемые для введения маркированного водяным знаком сигнала; на фиг.19 графически представлены некодированное сообщение, кодированное сообщение, сообщения синхронизации и сигнал водяного знака, в котором к сообщениям применена последовательность синхронизации; на фиг.20 схематически отображен первый шаг алгоритма так называемой "ABC-синхронизации"; на фиг.21 графически отображен второй шаг алгоритма так называемой "ABC-синхронизации"; на фиг.22 графически отображен третий шаг алгоритма так называемой "ABC-синхронизации"; на фиг.23 показана схема сообщения, содержащего полезную информацию и составляющую CRC; на фиг.24 дана принципиальная блочная схема реализации генератора водяных знаков согласно изобретению; на фиг.25 дана принципиальная блочная схема декодера водяных знаков согласно изобретению; на фиг.26 дана принципиальная блочная схема декодера водяных знаков согласно изобретению; на фиг.27 дана принципиальная блочная схема реализации портативного устройства распознавания водяного знака в соответствии с изобретением; на фиг.28 дана блок-схема способа формирования сигнала с водяным знаком в зависимости от данных двоичного сообщения; и на фиг.29 дана блок-схема способа формирования данных двоичного сообщения в зависимости от сигнала, маркированного водяным знаком.

Подробное техническое описание

1. Генерация водяного знака

1.1 Генератор водяных знаков в соответствии с фиг.24

Далее, со ссылкой на принципиальную блочную схему на фиг.24 будет описан генератор водяных знаков 2400.

Генератор водяных знаков 2400 предназначен для приема данных двоичного сообщения 2410 и генерации на их основе сигнала с водяным знаком 2420.

Генератор водяного знака 2400 включает в свою схему процессор информации 2430, который формирует в зависимости от информационных единиц (например, битов) данных двоичного сообщения 2410 первое представление во время-частотной области (первое время-частотное представление) 2432, значения которого отображают данные двоичного сообщения 2410.

Генератор водяного знака 2400 также включает в свою схему дифференциальный (разностный) кодер 2440, который формирует второе представление во время-частотной области (второе время-частотное представление) 2442 на основе первого представления во время-частотной области 2432 таким образом, что второе время-частотное представление 2442 содержит множество значений, разность между двумя из которых выражает соответствующее значение первого время-частотного представления 2432, для выполнения дифференциального кодирования значений первого представления во время-частотной области 2432.

Кроме того, генератор водяного знака 2400 включает в свою схему устройство вывода сигнала с водяным знаком 2450, которое формирует сигнал, маркированный водяным знаком 2420, на базе второго представления во время-частотной области 2442.

Генератор водяных знаков 2400 может быть дополнен любыми из отличительных признаков и функциональных возможностей, рассмотренных ниже в разделе 3.

1.2. Способ формирования сигнала с водяным знаком на основе данных двоичного сообщения в соответствии с фиг.28.

Рассмотрим со ссылкой на блок-схему фиг.28 алгоритм формирования сигнала с водяным знаком на основе данных двоичного сообщения.

Способ 2800 на фиг.28 включает в себя шаг 2810 формирования на основе информационных единиц данных двоичного сообщения первого время-частотного представления, значения которого отображают данные двоичного сообщения.

Способ 2800 также включает в себя шаг 2820 формирования на основе первого представления во время-частотной области второго представления во время-частотной области таким образом, что второе время-частотное представление содержит множество значений, разность двух из которых выражает соответствующее значение первого время-частотного представления для дифференциального кодирования значений первого представления во время-частотной области.

Наряду с этим, способ 2800 включает в себя шаг 2830 генерации сигнала, маркированного водяным знаком, на основе второго время-частотного представления.

Безусловно, способ 2800 может быть дополнен любыми из обсуждаемых здесь существенных признаков и функциональных возможностей, как и относящееся к изобретению оборудование.

2. Декодирование водяного знака

2.1. Декодер водяных знаков в соответствии с фиг.2

Дальше, со ссылкой на принципиальную блочную схему на фиг.25 будет описан декодер водяных знаков 2500.

Декодер водяных знаков 2500 предназначен для формирования данных двоичного сообщения 2520 в зависимости от сигнала с водяным знаком 2510.

Декодер водяного знака 2500 включает в свою схему блок формирования время-частотного представления 2530, который формирует первое представление во время-частотной области 2532 сигнала с водяным знаком 2510.

Декодер водяного знака 2500 также включает в свою схему дифференциальный декодер 2540, который формирует второе время-частотное представление 2542 на основе первого время-частотного представления 2532 таким образом, что значения второго время-частотного представления 2542 зависят от разностей фаз двух соответствующих (преимущественно, смежных) значений первого время-частотного представления 2532.

Кроме того, декодер водяного знака 2500 включает в свою схему детектор синхронизации 2550, который выводит из второго время-частотного представления 2542 данные синхронизации 2552.

Наряду с этим, декодер водяного знака 2500 включает в свою схему экстрактор водяного знака 2560, который извлекает данные двоичного сообщения 2520 из первого представления во время-частотной области 2532 сигнала с водяным знаком 2510 или из второго представления во время-частотной области 2542 сигнала с водяным знаком 2510, исходя из данных синхронизации 2552.

Безусловно, декодер водяных знаков 2500 может быть дополнен любыми из отличительных признаков и функциональных возможностей, рассматриваемых здесь применительно к декодированию водяных знаков.

2.2. Декодер водяных знаков в соответствии с фиг.26

Дальше, со ссылкой на принципиальную блочную схему на фиг.26 будет описан декодер водяного знака 2600.

Декодер водяного знака 2600 предназначен для приема сигнала с водяным знаком 2610 и извлечения из него данных двоичного сообщения 2620.

Декодер водяного знака 2600 имеет в своем составе блок формирования время-частотного представления 2630, формирующий первое представление во время-частотной области 2632 сигнала с водяным знаком 2610.

Декодер водяного знака 2600 также имеет в своем составе дифференциальный декодер 2640, предназначенный для формирования второго время-частотного представления 2642 на основе первого время-частотного представления 2632 таким образом, что значения второго время-частотного представления зависят от разностей фаз двух соответствующих (и, преимущественно, смежных по времени) значений первого время-частотного представления 2632.

Наряду с этим, декодер водяного знака 2600 имеет в своем составе экстрактор водяного знака 2650, предназначенный для извлечения данных двоичного сообщения 2620 из второго время-частотного представления 2642.

Безусловно, декодер водяного знака 2600 может быть дополнен любым из средств и функциональных возможностей, рассмотренных здесь применительно к декодированию водяных знаков.

2.3. Устройство распознавания водяного знака в соответствии с фиг.27

Ниже, опираясь на принципиальную блочную схему на фиг.27, рассмотрим портативное устройство распознавания водяного знака 2700.

Портативное устройство распознавания водяного знака 2700 укомплектовано микрофоном 2710, генерирующим на выходе электрический микрофонный сигнал 2712.

Портативное устройство распознавания водяного знака 2700 также имеет в своем комплекте декодер водяного знака 2720, который может быть идентичным декодерам водяного знака, описанным здесь.

Декодер водяного знака 2720 предназначен для приема сигнала микрофона 2712 как сигнала маркированного водяным знаком, для извлечения из него данных двоичного сообщения 2722.

Безусловно, декодер водяного знака 2720 может быть дополнен любым из средств и функциональных возможностей, описанных здесь относительно декодирования водяных знаков.

2.4. Способ формирования данных двоичного сообщения в зависимости от сигнала с водяным знаком в соответствии с фиг.29.

Дальше, со ссылкой на блок-схему на фиг.29 будет рассмотрен способ 2900 формирования данных двоичного сообщения в зависимости от сигнала с водяным знаком.

Способ 2900 включает в себя шаг 2910 формирования первого представления во время-частотной области сигнала с водяным знаком.

Способ 2900 также включает в себя шаг 2920 формирования второго время-частотного представления на основании первого время-частотного представления таким образом, что значения второго время-частотного представления зависят от разностей фаз двух соответствующих (предпочтительно, соседних) значений первого время-частотного представления.

Одновременно, способ 2900 включает в себя шаг 2930 получения из второго время-частотного представления данных синхронизации, используемых для формирования данных двоичного сообщения или извлечения данных двоичного сообщения из сигнала с водяным знаком.

Способ 2900 может быть дополнен любыми из существенных признаков и функциональных возможностей, рассмотренных здесь применительно к декодированию водяных знаков.

3. Описание системы Далее, будет описана система передачи водяного знака, которая включает в себя блок ввода водяного знака и декодер водяных знаков. Безусловно, блок ввода водяного знака и декодер водяных знаков могут использоваться независимо друг от друга.

Для описания системы выбран принцип "от сложного к простому". Сначала проведена дифференциация между кодером и декодером. Затем, в разделах с 3.1 по 3.5 подробно описан каждый рабочий блок в отдельности.

Базовая структура системы представлена на фигурах 1 и 2, где отображены, соответственно, сторона кодера и сторона декодера. На фиг.1 показана принципиальная блочная схема блока ввода водяного знака 100. На стороне кодера блоком обработки 101 (обозначенный как генератор водяных знаков) генерирует сигнал водяного знака 101b из двоичных данных 101a и из данных 104, 105 обмена информацией с психоакустическим процессором 102. Информация, полученная от блока 102, призвана гарантировать неслышность водяного знака. Затем, водяной знак, сгенерированный генератором водяных знаков 101, суммируют с аудиосигналом 106. После этого сигнал с водяным знаком 107 может быть ретранслирован, сохранен или передан для дальнейшей обработки. Мультимедийные файлы, например, аудио- и видеофайлы, требуют введения значительной задержки в видеопоток во избежание потери аудио- и видеосинхронизации. В случае многоканального аудиосигнала каждый канал обрабатывается отдельно, согласно пояснению, данному в этом документе. Блоки обработки 101 (генератор водяных знаков) и 102 (психоакустический процессор) детально рассмотрены в разделах 3.1 и 3.2, соответственно.

На фигуре 2 в виде принципиальной блочной схемы детектора водяного знака 200 отображена сторона декодера. В систему 200 поступает маркированный водяным знаком аудиосигнал 200a, например, от микрофона. Первый блок 203, обозначенный как модуль анализа, демодулирует и трансформирует данные (например, аудиосигнал с водяным знаком) во временной/частотной области (формируя посредством этого время-частотное представление 204 аудиосигнала с водяным знаком 200a), пересылая их на модуль синхронизации 201, который анализирует входной сигнал 204 и выполняет синхронизацию, в частности, рассчитывает временное выравнивание кодированных данных (например, кодированных данных водяного знака относительно представления во время-частотной области).Эта информация (например, результирующие данные синхронизации 205) поступают на экстрактор водяного знака 202, который декодирует полученные данные (формируя соответствующие двоичные данные 202a, которые представляют содержимое данных маркированного водяным знаком аудиосигнала 200a).

3.1 Генератор водяных знаков 101

Подробная схема генератора водяных знаков 101 представлена на фигуре 3. Двоичные данные (выраженные как ±1), которые должны быть скрыты в аудиосигнале 106, вводят в генератор водяных знаков 101. Блок 301 упорядочивает принятые данные 101a в пакеты одинаковой длины M_p. К каждому пакету в качестве сигнальных добавляют служебные биты (например, в виде постфикса). Пусть M_s обозначает их количество. Более подробно их использование будет объяснено в разделе 3.5. В дальнейшем каждый пакет битов полезной информации вместе с присоединенными служебными сигнальными битами будет называться сообщением.

Каждое сообщение 301 а длиной N_m=M_s+M_p пересылают в кодер канала, блок обработки 302, который отвечает за кодирование битов для защиты от ошибок. Возможно конструктивное решение этого модуля, при котором он состоит из сверточного кодера в сочетании с устройством временного уплотнения импульсных сигналов. Коэффициент преобразования сверточного кодера оказывает большое влияние на общую степень защиты от ошибок системы цифровой маркировки водяными знаками. С другой стороны, устройство временного уплотнения импульсных сигналов обеспечивает защиту от всплесков шумов. Рабочий диапазон устройства временного уплотнения импульсных сигналов может быть ограничен одним сообщением, однако он может быть расширен до большего числа сообщений. Обозначим коэффициент кодирования, например, 1/4, как R_c. Количество закодированных битов для каждого сообщения составит N_m/R_c. Кодер каналов 302 генерирует на выходе, например, кодированное двоичное сообщение 302a.

Следующий блок обработки 303 выполняет расширение в частотной области. Для обеспечения удовлетворительного соотношения сигнал-шум информацию (например, двоичного сообщения 302a) расширяют и передают по N_f тщательно подобранным подполосам. Их точное частотное позиционирование определяют априорно и задают как для кодера, так и для декодера. Подробности подбора этого важного системного параметра даны в разделе 3.2.2. Расширение по частоте определяется последовательностью расширения c_f размерностью N_f×1. Выходной сигнал 303a блока 303 состоит из N_f двоичных потоков - по одному на каждую подполосу. Двоичный поток (битстрим)i рассчитывают, умножая входной бит на компонент i последовательности расширения c_f. Простейшее расширение состоит в копировании битстрима в каждый выходной поток, в частности, использовать последовательность расширения из единиц.

Блок 304, обозначенный как устройство введения схемы синхронизации, добавляет к битстриму сигнал синхронизации. Надежная синхронизация важна, поскольку в декодере отсутствуют параметры временного выравнивания как битов, так и структуры данных, то есть данные о начале каждого сообщения. Синхросигнал состоит из N_s последовательностей N_f по N_f битов в каждой. Последовательности поэлементно и периодически перемножают на поток (или потоки) битов 303a. Допустим, a, b, и c составляют Ns=3 последовательности синхронизации (обозначенные как последовательности синхронизирующего расширения).

Блок 304 умножает a на первый бит распространения, b - на второй бит расширения и c - на третий бит расширения. Для последующих битов применяется итерация, а именно, a умножается на четвертый бит, b - на пятый и так далее. Соответствующим образом формируется объединенная информация о данных синхронизации 304a. Последовательности синхронизации (обозначенные как синхронизирующие последовательности расширения) тщательно подбирают для минимизации риска ложной синхронизации. Дальнейшие подробности представлены в разделе 3.4. Кроме того, следует учитывать, что последовательность a, b, c, … можно рассматривать как последовательность синхронизирующих последовательностей расширения.

Блок 305 выполняет расширение во временной области. Каждый бит расширения на входе, в частности, вектор длины N_f, повторяется во временной области N_t раз. Аналогично расширению по частоте мы рассчитываем последовательность расширения c_t размерностью N_t×1. Повторение i времени умножают на i-й компонент c_t.

Математически операции блоков 302-305 могут быть выражены следующим образом. Пусть m размерностью 1×N_m=R_c будет закодированным сообщением на выходе блока 302.

Тогда на выходе блока 303 сигнал 303a (который можно рассматривать как представление данных расширения R) будет иметь вид

$c_{f} \cdot m o f s i z e N_{f} \times N_{m} / R_{c} (1)$ ,

на выходе блока 304 сигнал 304a, который можно рассматривать как объединенное представление синхронизации данных C, имеет вид

$S \circ (c_{f} \cdot m) o f s i z e N_{f} \times N_{m} / R_{c} (2)$ ,

где º обозначает поэлементное произведение Шура, и

$S = [\dots a b c \dots a b \dots] o f s i z e N_{f} \times N_{m} / R_{c} . (3)$ .

Выходной сигнал 305a блока 305 представляет собой

$(S \circ (c_{f} \cdot m)) ⋄ c_{t}^{T} o f s i z e N_{f} \times N_{t} \cdot N_{m} / R_{c} (4)$ ,

где ◊ и ^T обозначают Кронекерово умножение и транспозицию, соответственно. Следует помнить, что двоичные данные выражены как ±1.

Блок 306 выполняет дифференциальное кодирование битов. Этот шаг дает системе дополнительную устойчивость против фазовых сдвигов, обусловленных движением или рассогласованием гетеродина. Более детально этот вопрос рассмотрен в разделе 3.3. Если b(i;j) - бит для полосы частот i и временного блока j на входе блока 306, выходной бит b_diff(i;j) будет

$b_{d i f f} (i, j) = b_{d i f f} (i, j - 1) \cdot b (i, j) . (5)$

В начале потока, то есть для j=0, b_diff(i,j-1) задается как 1.

Блок 307 (провайдер сигнала водяного знака) выполняет действительную модуляцию, то есть генерацию формы волны сигнала водяного знака в зависимости от двоичных данных 306a на входе. Детализация схемного решения дана на фигуре 4. N_f параллельных вводов с 401 по 40N_f содержат битстримы для разных подполос. Каждый бит каждого подполосового потока обрабатывается блоком формирования бита (411-41N_f). Выходом блоков формирования бита являются формы волны во временной области. Форму волны, генерируемую для временного блока j и подполосы i, обозначенную как S_i;j(t), на основе входного бита b_diff(i,j) вычисляют следующим образом

$s_{i, j} (t) = b_{d i f f} (i, j) γ (i, j) \cdot g_{i} (t - j \cdot T_{b}), (6)$

где γ(i;j) - весовой коэффициент, рассчитанный психоакустическим процессором 102, T_b - битовый интервал, и g_i(t) - функция, формирующая бит для подполосы i. Формирующую бит функцию выводят из основополосной функции $g_{i}^{T} (t)$ , косинусно модулированной по частоте

$g_{i} (t) = g_{i}^{T} (t) \cdot \cos (2 π f_{i} t), (7)$

где f_i - средняя частота подполосы i, а верхний индекс Т обозначает передатчик. Основополосные функции могут быть разными для каждого поддиапазона. При из идентичности на стороне декодера возможно более эффективное осуществление. Более подробное описание см. в разделе 3.3.

Каждый бит формируется в итеративном режиме, управляемом психоакустическим процессором (102). Итерации необходимы для тонкой юстировки весов γ(i,j) для наделения водяного знака максимально возможной энергией при сохранении его неслышности. Дальнейшие подробности представлены в разделе 3.2.

Полная форма волны на выходе i-го фильтра формирования бита 41i-

$s_{i} (t) = \sum_{j} s_{i, j} (t) . (8)$

Формирующая бит основополосная функция $g_{i}^{T} (t)$ обычно не равна нулю для интервала времени, намного превышающего T_b, притом что основная энергия сконцентрирована в интервале бита. В качестве примера можно привести график на фигуре 12A, где одна и та же формирующая бит основополосная функция применена для двух смежных битов. На фигуре T_b=40 мс. Выбор T_b, как и форма функции значительно влияет на систему. Фактически, большее количество символов дает более узкие частотные характеристики. Это особенно благоприятно для реверберирующих сред. Действительно, при подобных сценариях сигнал с водяным знаком попадает в микрофон по нескольким путям распространения, каждый из которых характеризуется отличным от других временем прохождения. Результирующий канал характеризуется значительной частотной избирательностью. При интерпретации во временной области более длинные символы имеют то преимущество, что они как эхо имеют задержку, сопоставимую с усиливающей интерференцией, результирующей из битового интервала, что означает, что они наращивают энергию принимаемого сигнала. Несмотря на это, более длинные символы имеют ряд недостатков: большее перекрывание может вызывать межсимвольную интерференцию (ISI), и его гораздо труднее скрыть в аудиосигнале таким образом, чтобы психоакустический процессор пропускал меньшую энергию, чем для более коротких символов.

Сигнал водяного знака выводят как суммарный выходной сигнал всех фильтров формирования бита

$\sum_{i} s_{i} (t) . (9)$

3.2 Психоакустический процессор 102

Как видно на фигуре 5, психоакустический процессор 102 состоит из 3 элементов. Первый элемент - модуль анализа 501, который преобразует временной аудиосигнал во время/частотную область. Этот модуль анализа может выполнять анализ параллельно с разной разрешающей способностью по времени/частоте. Из модуля анализа время/частотные данные [504] поступают в блок психоакустического моделирования (PAM) 502, который рассчитывает пороги маскирования для водяного знака по психоакустическим параметрам (см. Е. Zwicker, H.Fastl. "PsychoacousticsFactsandModels"). Пороги маскирования служат показателем количества энергии, которая может быть скрыта в аудиосигнале для каждой подполосы и временного блока. Последним элементом психоакустического процессора 102 является модуль расчета амплитуды 503. Этот модуль рассчитывает уровни усиления по амплитуде, которые должны быть применены при генерации сигнала водяного знака с соблюдением порогов маскирования, то есть задействованная энергия должна быть меньше или равна энергии, заданной порогами маскирования.

3.2.1 Время/частотный анализ 501

Блок 501 выполняет время/частотное преобразование аудиосигнала путем преобразования с перекрытием. Наилучшее качество звука может быть достигнуто при условии использования многоуровневой разрешающей способности по времени/частоте. Эффективным преобразованием с перекрытием является короткое (/оконное) преобразование Фурье (КПФ) (/ОПФ), основанное на быстрых преобразованиях Фурье (БПФ) оконно-взвешенных временных блоков. Длина окна определяет частотно-временную разрешающую способность таким образом, что более длинные окна характеризуются большей продолжительностью по времени и более высоким разрешением по частоте, а короткие окна - наоборот. Вместе с тем, форма окна, среди прочего, определяет утечку по частоте.

В предложенной системе мы добиваемся неслышного водяного знака, анализируя данные посредством двух разных уровней разрешения. Первый банк фильтров характеризуется величиной шага T_b, т.е. длиной бита. Величина шага - это временной интервал между двумя соседними временными блоками. Длина окна приблизительно равна T_b. Следует принимать во внимание, что форма окна не обязательно должна повторять форму окна, примененную для формирования бита, а должна в целом имитировать слуховой аппарат человека. Изучению этой проблемы посвящено множество публикаций.

Во втором банке фильтров используется более короткое окно. Высокое временное разрешение особенно важно при маркировке водяными знаками речи, поскольку ее временная структура, как правило, тоньше, чем T_b.

Частота дискретизации входного аудиосигнала не важна, поскольку она достаточна для описания сигнала водяного знака без алиасинга. Например, если наибольшая частотная составляющая сигнала водяного знака - 6 кГц, то частота дискретизации временных сигналов должна быть, по меньшей мере, 12 кГц.

3.2.2 Блок психоакустического моделирования 502

Функция блока психоакустического моделирования 502 состоит в определении порогов маскирования, то есть в расчете энергии, которая может быть скрыта в аудиосигнале для каждой подполосы частот и блока времени так, чтобы аудиосигнал с водяным знаком оставался неразличимым на оригинальном звуковом фоне.

Подполосу i задают между двумя пределами, а именно, $f_{i}^{(\min)}$ и $f_{i}^{(\max)}$ . Подполосы определяют путем выделения N_f средних частот f_i и допущения, что $f_{i - 1}^{(\max)} = f_{i}^{(\min)}$ i для i=2, 3, …, N_f. Надлежащий выбор средних частот обеспечивает шкала Барка, предложенная Цвикером в 1961 году. Для более высоких средних частот подполосы увеличиваются. В одной из возможных версий реализации системы использовано 9 поддиапазонов, расположенных соответствующим образом между 1,5 и 6 кГц.

Следующие операции обработки выполняются отдельно для каждого уровня частотно-временного разрешения для каждой подполосы частот и каждого временного блока. На технологической ступени 801 выполняют спектральное сглаживание. Как тональные элементы, так и разрывы в спектре мощности должны быть сглажены. Это может быть выполнено несколькими способами. Мера тональности может быть рассчитана для дальнейшего подбора адаптивного сглаживающего фильтра. В упрощенном альтернативном варианте исполнения этого блока может быть применен медианоподобный фильтр. Медианный фильтр учитывает вектор показателей и выводит их срединное (медианное) значение. В медианоподобном фильтре может быть выбрано значение, соответствующее квантили, отличной от 50%. Ширину фильтра определяют в Гц и применяют как нелинейное скользящее среднее значение, которое начинается на нижних частотах и заканчивается на возможно максимальной частоте. Операция [сглаживания спектра] 801 проиллюстрирована на фигуре 7. Кривой красного цвета (мелким пунктиром) обозначен результирующий сигнал сглаживания.

После выполнения сглаживания с помощью блока 802 рассчитывают пороговые значения только частотного маскирования. Данная процедура также имеет варианты выполнения. Один из способов состоит в использовании минимума для каждой подполосовой составляющей для вычисления маскирующей энергии E_i. Это - энергия, эквивалентная сигналу, который эффективно обеспечивает маскирование. Исходя из этого значения простым умножением на определенный масштабный коэффициент можно получить маскируемую энергию J_i. Такие коэффициенты будут разными для каждой подполосы и частотно-временного разрешения, их выводят эмпирическим путем на основе психоакустических опытов. Фрагменты такого сценария проиллюстрированы на фигуре 8.

С помощью блока 805 рассчитывают пороговые значения временного маскирования. В этом случае для одной и той же подполосовой составляющей анализируют разные временные блоки. Маскированные энергии J_i модифицируют в соответствии с выведенными опытным путем профилями постмаскирования. Рассмотрим два смежных временных блока, k-1 и k. Соответствующими им маскируемыми энергиями будут J_i(k-1) и J_i(k). Профиль постмаскирования определяет, например, что маскирующая энергия E_i способна маскировать энергию J_i во время k и α·J_i во время k+1. В этом случае блок 805 сравнивает J_i(k) (энергию, маскируемую текущим временным блоком) и α·J_i(k+1) (энергию, маскированную предшествующим временным блоком) и выбирает максимум. Профили постмаскирования выстроены эмпирически, исходя из психоакустических экспериментов, и доступны в соответствующей литературе. Следует принять к сведению, что при больших значениях T_b, т.е. >20 мс, постмаскирование применяют только к частотно-временному разрешению более коротких временных окон.

Итак, на выходе блока 805 имеем пороги маскирования для каждой подполосовой составляющей и временного блока, рассчитанные для двух разных частотно-временных разрешений. Эти пороговые значения получены с учетом как частотных, так и временных маскирующих явлений. С помощью блока 806 выполняют совмещение пороговых величин различных частотно-временных разрешений. Например, одним из возможных вариантов является тот, при котором блок 806 учитывает все пороговые значения, соответствующие частотно-временным интервалам, в которых расположен бит, и выбирает минимум.

3.2.3 Блок расчета амплитуды 503

Обратимся к фигуре 9. Входными данными блока 503 являются выходные пороговые значения 505 блока психоакустического моделирования 502, который выполняет все вычисления, связанные с психоакустикой. Вычислитель амплитуд 503 выполняет дополнительные вычисления с использованием введенных в него пороговых значений. В первом блоке выполняется картирование амплитуд 901. С помощью этого блока величины порогов маскирования (обычно выраженные как величины энергии) преобразуют в величины амплитуд, которые могут быть использованы для масштабирования функции формирования бита, охарактеризованной в разделе 3.1. Далее задействуют блок адаптации амплитуд 902. Этот блок предназначен для итеративной адаптации амплитуд γ(i,j), используемых для умножения функций формирования бита в генераторе водяных знаков 101 таким образом, чтобы в действительности удовлетворять пороговым значениям маскирования. Как уже говорилось, фактически функция формирования бита, как правило, занимает промежуток времени, превышающий T_b. Следовательно, умножение корректной амплитуды γ(i,j), удовлетворяющей порогу маскирования в точке i, j, не обязательно удовлетворяет требованиям в точке i, j-1. Это особенно важно в случаях атак, когда акустически проявляется предэхо. Другой ситуацией, которую следует избегать, является несоответствующая суперпозиция хвостов разных битов, приводящих к озвучиванию водяного знака. Таким образом, блок 902 анализирует выходной сигнал генератора водяных знаков на соответствие пороговым значениям. В случае несоответствия этот блок модифицирует амплитуды γ(i,j) надлежащим образом.

На этом рассмотрение стороны кодера завершается. Последующие разделы посвящены технологическим операциям приемника (обозначенного как декодер водяных знаков).

3.3 Модуль анализа 203

Модуль анализа 203 является первым этапом (или блоком) экстракции водяного знака. Его назначение - в обратном преобразовании аудиосигнала с водяным знаком 200a в N_f битстримов ${\overset{⌢}{b}}_{i} (j)$ 204, по одному потоку для каждой подполосы i спектра. Затем, битовые потоки поступают для обработки в модуль синхронизации 201 и в экстрактор водяного знака 202, что описано в разделах 3.4 и 3.5, соответственно. Следует обратить внимание, что ${\overset{⌢}{b}}_{i} (j)$ представляют собой гибкие двоичные потоки, что значит, что они могут, например, принимать любое действительное значение без окончательного оформления бита.

Модуль анализа состоит из трех компонентов, отображенных на фигуре 16: банка фильтров анализа 1600, блока нормализации амплитуды 1604 и блока дифференциального декодирования 1608.

3.3.1 Банк фильтров анализа 1600

С помощью анализирующего банка фильтров 1600, детализированная схема которого показана на фигуре 10A, маркированный водяным знаком аудиосигнал преобразуют во время-частотную область. На входе банк фильтров принимает аудиосигнал с водяным знаком r(t). На выходе он генерирует комплексные коэффициенты $b_{i}^{A F B} (j)$ для ветви или подполосы i в момент времени j. Эти значения содержат информацию об амплитуде и фазе сигнала на средней частоте f_i и в момент времени j·Tb.

Банк фильтров 1600 состоит из N_f ветвей, по одной для каждой подполосы i. Каждая ветвь делится на верхнее ответвление для синфазной составляющей и нижнее ответвления для квадратурной составляющей поддиапазона i. Несмотря на то, что модуляция в генераторе водяных знаков и, следовательно, аудиосигнал с водяным знаком имеют простые действительные значения, на стороне приемника необходим комплекснозначный анализ сигнала, поскольку в приемнике отсутствуют данные о чередованиях факторов модуляции вследствие влияния каналов и рассогласований синхронизации. Рассмотрим дальше ветвь i банка фильтров. Совмещая синфазное и квадратурное ответвления, рассчитаем комплекснозначный модулирующий сигнал $b_{i}^{A F B} (t)$

$b_{i}^{A F B} (t) = r (t) \cdot e^{- j 2 π f_{i} t} * g_{i}^{R} (t) (10)$ ,

где * обозначает свертку, a $g_{i}^{R} (t)$ - импульсная характеристика фильтра нижних частот приемника для подполосы i. Как правило, $g_{i}^{R} (t)$ i (t) равно функции формирования бита базовой полосы пропускания подполосы i в блоке 307, чтобы выполнялись условия согласованного фильтра, однако возможны и другие импульсные характеристики.

Чтобы получить коэффициенты $b_{i}^{A F B} (j)$ при скорости 1=T_b, необходим отбор отсчетов непрерывного выходного сигнала $b_{i}^{A F B} (t)$ . Если бы на приемной стороне была известна точная синхронизация битов, дискретизация со скоростью 1=T_b была бы достаточной. Однако поскольку данные синхронизации битов отсутствуют, дискретизацию выполняют со скоростью N_os/T_b, где N_os - коэффициент избыточности дискретизации банка фильтров анализа. Подбирая достаточно большое значение N_os (например, N_os=4), можно -гарантировать, что, по меньшей мере, один цикл дискретизации достаточно близок к идеальной синхронизации битов. Оптимальный уровень дискретизации с повышенной частотой выбирается в процессе синхронизации, поэтому все данные избыточной дискретизации сохраняются до начала этой операции. Подробнее этот процесс описан в разделе 3.4.

На выходе ветви i получаем коэффициенты $b_{i}^{A F B} (j, k)$ , где j обозначает номер бита или момент времени, a k обозначает позицию уплотненной дискретизации внутри этого одиночного бита, где k=1; 2; …, N_os.

На фигуре 10B графически представлен пример распределения коэффициентов на время-частотной плоскости. Коэффициент избыточности дискретизации N_os=2. Высота и ширина прямоугольников указывают, соответственно, ширину полосы и отрезок времени фрагмента сигнала, представленного соответствующим коэффициентом $b_{i}^{A F B} (j, k)$ .

Если частоты подполосы f_i выбраны кратными некоторому интервалу Δf, банк фильтров анализа может быть эффективно реализован с использованием быстрого преобразования Фурье (БПФ).

3.3.2 Нормализация амплитуды 1604

Чтобы, не отступая от основной темы, упростить описание, в дальнейшем допустим, что синхронизация битов известна, и что N_os=1. Это значит, что мы имеем комплексные коэффициенты $b_{i}^{A F B} (j)$ на входе блока нормализации 1604. В силу того, что информация о состоянии канала недоступна на приемной стороне (т.е. канал прохождения не известен), применяют схему линейного суммирования сигналов равной мощности (EGC). Вследствие рассеивающей способности канала по времени и частоте энергия переданного бита b_i(j) обнаруживается не только вокруг средней частоты f_i и момента времени j, но и на соседних частотах и в смежные моменты времени. Поэтому для более точного взвешивания на частотах f_i±nΔf рассчитывают дополнительные коэффициенты, которые используют для нормализации коэффициента $b_{i}^{A F B} (j)$ . Если n=1, мы имеем, например,

$b_{i}^{n o r m} (j) = \frac{b_{i}^{A F B} (j)}{\sqrt{1 / 3 \cdot ({| b_{i}^{A F B} (j) |}^{2} + {| b_{i - Δ f}^{A F B} (j) |}^{2} + {| b_{i + Δ f}^{A F B} (j) |}^{2})}} (11)$

Нормализация при n>1 представляет собой прямое расширение приведенной выше формулы. Таким же образом мы можем выбрать для нормализации гибкие биты, учитывая более одного момента времени. Нормализацию выполняют для каждого поддиапазона i и каждого момента времени j. Фактическое сложение EGC выполняют на более поздних шагах процесса экстракции.

3.3.3 Дифференциальное декодирование 1608

На вход блока дифференциального декодирования 1608 поступают нормализованные комплексные коэффициенты $b_{i}^{n o r m} (j)$ амплитуд, содержащие информацию о фазе компонент сигнала на частоте f_i в момент времени j. Поскольку биты дифференциально закодированы на передающей стороне, здесь должно быть произведено обратное действие. Гибкие биты ${\overset{\land}{b}}_{i} (j)$ формируются путем, во-первых, вычисления разности фаз двух последовательных коэффициентов и, затем, выделения вещественной части:

${\overset{\land}{b}}_{i} (j) = Re {b_{i}^{n o r m} (j) \cdot b_{i}^{n o r m *} (j - 1)} (12)$

$= Re {| b_{i}^{n o r m} (j) | \cdot | b_{i}^{n o r m} (j - 1) | \cdot e^{j (ϕ j - ϕ j - 1)}} (13)$

Эти действия должны выполняться раздельно для каждой подполосы, поскольку канал обычно вносит разные чередования фаз в каждой подполосовой составляющей.

3.4 Модуль синхронизации 201

Задача модуля синхронизации состоит во временном выравнивании водяного знака. Синхронизация декодера относительно кодированных данных представляет собой двоякую задачу. На первом этапе банк фильтров анализа должен быть приведен в соответствие с кодированными данными, в частности, функции формирования бита $g_{i}^{T} (t)$ , использованные при синтезе в модуляторе, должны быть приведены в соответствие с фильтрами $g_{i}^{R} (t)$ , используемыми для анализа. Эта задача проиллюстрирована на фигуре 12A, где фильтры анализа идентичны фильтрам синтеза. На верхнем графике показаны три бита. Для упрощения формы волны для всех трех битов не масштабированы. Шаг по времени между битами - T_b. На нижнем графике проиллюстрирована процедура синхронизации в декодере: фильтр может быть применен в разные моменты времени, тем не менее, правильными являются только координаты по красной (жирной) кривой 1299a, которые обеспечивают экстракцию первого бита с лучшими показателями соотношения сигнал-шум SNR и соотношения сигнал-помеха SIR. На практике некорректное выравнивание привело бы к деградации SNR и SIR. Мы обозначили это первое выравнивания термином "синхронизация битов". Благодаря достижению синхронизации битов извлечение битов выполняется в оптимальном режиме. При этом, чтобы корректно расшифровать сообщение, необходимо знать, с какого бита начинается новое сообщение. Эта задача, называемая синхронизацией сообщения, графически проиллюстрирована на фигуре 12B. В потоке декодированных битов только начальная позиция 1299b, маркированная красным, является верной и позволяет декодировать сообщение k.

Сначала обратимся только к синхронизации сообщения. Сигнатура синхронизации, как объяснено в разделе 3.1, состоит из предварительно заданного порядка из Ns последовательностей, которые непрерывно и периодически вводят в водяной знак. Модуль синхронизации выполнен с возможностью распознавания временного выравнивания последовательностей синхронизации. В зависимости от размера N различают два режима выполнения операции, которые отображены на фигурах 12C и 12D, соответственно.

В режиме синхронизации полного сообщения (фиг.12C) N_s=N_m/R_c. Для упрощения фигуры принято, что N_s=N_m/R_c=6 и N_t=1, т.е. отсутствует расширение по времени. Для наглядности применяемая сигнатура синхронизации показана под сообщениями. В действительности их модулируют в зависимости от закодированных битов и последовательностей расширения по частоте, как объяснено в разделе 3.1. В этом режиме периодичность сигнатуры синхронизации совпадает с периодичностью сообщений. Таким образом, модуль синхронизации может распознавать начало каждого сообщения по временному выравниванию сигнатуры синхронизации. Временные координаты начала новой сигнатуры синхронизации обозначены как точки синхронности. Затем, точки синхронности передаются в экстрактор водяного знака 202.

Второй возможный режим - синхронизация неполного сообщения проиллюстрирован на фигуре 12D. В этом случае N_s<N_m=R_c. Для этой фигуры принято, что N_s=3, таким образом, что три последовательности синхронизации повторяются дважды для каждого сообщения. Следует учитывать, что периодичность сообщений не обязательно кратна периодичности сигнатуры синхронизации. В этом режиме не все точки синхронности совпадают с началом сообщения. Модуль синхронизации не предусматривает определение различия между точками синхронности, и эта операция возложена на экстрактор водяного знака 202.

Обрабатывающие блоки модуля синхронизации показаны на фигурах 11A и 11B. Модуль синхронизации одновременно выполняет синхронизацию битов и синхронизацию сообщений (полных или неполных), анализируя выходной сигнал коррелятора сигнатуры синхронизации 1201. Данные во время/частотной области 204 поступают от модуля анализа. Поскольку синхронизация битов еще не доступна, блок 203 передискретизирует данные с коэффициентом N_os, как описано в разделе 3.3. Полные входные данные показаны на фигуре 12E. В этом примере N_os=4, N_t=2 и N_s=3. Другими словами, сигнатура синхронизации состоит из 3 последовательностей (обозначенных a, b и c). Расширение по времени, в этом случае - с помощью последовательности расширения c_t=[1 1]^T, выполняется за счет простого повторения каждого бита дважды во временной области. Точные точки синхронности обозначены стрелками и соответствуют началу каждой сигнатуры синхронизации. Период сигнатуры синхронизации составляет N_t·N_os·N_s=N_sbl, что, например, равно 2·4·3=24. В силу периодичности сигнатуры синхронизации коррелятор сигнатуры синхронизации (1201) произвольно делит ось времени на блоки, называемые блоками поиска, размером N_sbl, где нижний индекс указывает длину блока поиска. Каждый блок поиска должен содержать (или обычно содержит) одну точку синхронности, как показано на фигуре 12F. Каждый из битов N_sbl является кандидатной точкой синхронности. Задачей блока 1201 является расчет степени правдоподобия для каждого кандидатного бита в каждом блоке. Далее эта информация передается в блок 1204 для вычисления точек синхронности.

3.4.1 Коррелятор сигнатуры синхронизации 1201

Для каждой кандидатной позиции синхронизации N_sbl коррелятор сигнатуры синхронизации вычисляет показатель правдоподобия, который тем выше, чем выше вероятность того, что будет распознано временное выравнивание (как битовая, так и полная или неполная синхронизация сообщения). Последовательность технологических операций показана на фигуре 12G.

В результате может быть выведена последовательность 1201a показателей правдоподобия, соотнесенных с различными выбранными позициями.

Блок 1301 выполняет временную свертку, то есть умножает каждый из битов N_t на последовательность временного расширения и затем суммирует их. Это действие выполняется для каждого из частотных поддиапазонов N_f. На фигуре 13A приведен пример. Для примера взяты те же параметры, что и в предыдущем разделе, а именно - N_os=4, N_t=2 и N_s=3. Отмечена кандидатная позиция синхронизации. От этого бита с шагом N_os блок 1301 отсчитывает N_t·N_s и выполняет временную свертку, используя последовательность c_t, оставляя биты Ns.

В блоке 1302 эти биты поэлементно умножаются на последовательности расширения N_s (см. фигуру 13B).

Блок 1303 выполняет частотную свертку, а именно умножает каждый бит на последовательность расширения c_f и затем суммирует по частоте.

На этом этапе, если положение синхронизации корректно, мы имели бы декодированные биты N_s. Поскольку на стороне приемника биты не известны, блок 1304 вычисляет меру правдоподобия, применяя абсолютные величины значений и сумм N_s.

В принципе, на выходе блока 1304 нужен некогерентный коррелятор, который ищет сигнатуру синхронизации. На практике при выборе небольшого значения N_s, а именно - режима синхронизации неполного сообщения, можно использовать последовательности синхронизации (например, a, b, c), которые взаимно ортогональны. При этом при некорректном выравнивании коррелятора по сигнатуре его выходное значение будет очень маленьким, в идеале - равным нулю. В случае задействования режима синхронизации полного сообщения рекомендуется использовать столько ортогональных последовательностей синхронизации, сколько возможно, после чего создать сигнатуру путем тщательного подбора порядка их применения. В этом случае может быть применена та же теория, что и при поиске последовательности расширения с надлежащими функциями автокорреляции. Когда коррелятор имеет лишь небольшое рассогласование, то выходное значение коррелятора не будет равно нулю даже в идеальном случае, однако в любом случае будет меньше по сравнению с точным выравниванием, поскольку фильтры анализа не могут оптимально улавливать энергию сигнала.

3.4.2 Вычисление точек синхронности 1204

Этот блок анализирует выходные данные коррелятора сигнатуры синхронизации для определения позиций синхронизации. В силу того, что система довольно устойчива к рассогласованиям вплоть до T_b/4, а T_b обычно приближается к 40 мс, выходные данные блока 1201 можно интегрировать во времени с достижением более стабильной синхронизации. Осуществление такого подхода возможно с применением фильтра с бесконечной импульсной характеристикой (БИХ) во времени при экспоненциально затухающей импульсной характеристике. Альтернативно может быть применен традиционный фильтр со скользящим средним значением конечной импульсной характеристики (КИХ). Поскольку усреднение уже было выполнено, выполняют вторую корреляцию между других N_t·N_s ("выбор другой позиции"). Фактически, мы хотим задействовать информацию, где функция автокорреляции функции синхронизации известна. Это соответствует оцениванию максимального правдоподобия. Этот аспект проиллюстрирован на фигуре 13C. Кривая отображает выходной сигнал блока 1201 после временного интегрирования. Один из возможных способов определения точки синхронности состоит в простом нахождении максимума этой функции. На фигуре 13D мы видим эту же функцию (нежирная кривая) после фильтрации автокорреляционной функцией сигнатуры синхронизации. График результирующей функции выделен красной (жирной) линией. В этом случае максимум более выражен и определяет координаты точки синхронности. Эти два способа примерно одинаковы в смысле высокого SNR, но второй способ лучше подходит для более низких режимов SNR. После нахождения точек синхронности их вводят в экстрактор водяного знака 202, который декодирует данные.

В некоторых версиях исполнения для формирования устойчивого синхросигнала, синхронизацию выполняют в режиме неполного сообщения с короткими сигнатурами синхронизации. Для этого необходим большой объем декодирования, что увеличивает риск распознавания ложно-значимых сообщений. Для предотвращения этого явления в некоторых реализациях в сообщения вставляют сигнальные последовательности, что приводит к более низкому битрейту.

Этот подход применим при решении проблемы, возникающей, когда сигнатура синхронизации короче сообщения, что уже было рассмотрено выше в контексте оптимизации синхронизации. В подобном случае декодеру не известно, где начинается новое сообщение, и он пытается приступить к декодированию в нескольких точках синхронизации. Чтобы различать действительные и ложно-действительные сообщения некоторые технические решения предусматривают использование сигнального слова (т.е. полезную информацию жертвуют в пользу включения известной управляющей последовательности). В некоторых вариантах осуществления для дифференциации распознавания действительных и ложных сообщений применяют контроль правдоподобия (альтернативно или дополнительно).

3.5 Экстрактор водяного знака 202

Элементы компоновки экстрактора водяного знака 202 показаны на фигуре 14. Он имеет два входа, а именно 204 и 205, от блоков 203 и 201, соответственно. От модуля синхронизации 201 (см. раздел 3.4) поступают синхронизирующие метки времени, то есть координаты во временной области, где начинается кандидатное сообщение. Более детально этот вопрос рассмотрен в разделе 3.4. На второй вход от банка анализирующих фильтров 203 поступают данные время/частотной области, готовые для декодирования.

На первом этапе обработки блок выбора данных 1501 распознает составляющую входных данных 204 как предполагаемое сообщение для декодирования. На фигуре 15B эта процедура представлена графически. Входные данные 204 состоят из N_f потоков действительных значений. Так как декодер априорно не известны данные выравнивания по времени, блок анализа 203 выполняет частотный анализ со скоростью, более 1/T_b Гц (избыточная дискретизация). В контексте фигуры 15B использован коэффициент избыточности дискретизации 4, а именно, каждые T_b секунды выдаются 4 вектора размерностью N_f×1. Когда блок синхронизации 201 идентифицирует кандидатное сообщение, он выдает метку времени 205 с указанием точки отсчета предполагаемого сообщения. Блок выбора данных 1501 выбирает информацию, необходимую для декодирования, а именно матрицу размерностью N_f×N_m/R_c. Эта матрица 1501a передается в блок 1502 для последующей обработки.

Блоки 1502, 1503 и 1504 выполняют те же операции, что и блоки 1301, 1302 и 1303, о чем говорится в разделе 3.4.

Альтернативное техническое решение изобретения исключает из алгоритма вычисления с использованием блоков 1502-1504 и дополняет функции модуля синхронизации подготовкой данных для декодирования. С концептуальной точки зрения это - частность. С точки зрения технического исполнения это - лишь вопрос того, как реализуются буферы. В целом, повторное выполнение вычислений позволяет уменьшить объем буферов.

Канальный декодер 1505 выполняет операцию, обратную блоку 302. Если кодер каналов в возможном варианте исполнения этого модуля будет состоять из сверточного кодера в сочетании с устройством временного уплотнения импульсных сигналов, то канальный декодер будет выполнять разуплотнение и сверточное декодирование, например, с применением известного алгоритма Витерби. На выходе этого блока получаем N_m битов, т.е. кандидатное сообщение.

Блок сигнализации и контроля правдоподобия 1506 определяет, является ли входное кандидатное сообщение действительным сообщением. Существуют различные алгоритмы решения этой задачи.

Основная идея состоит в использовании сигнального слова (например, последовательности циклического контроля избыточности CRC) для дифференциации между истинными и ложными сообщениями. Однако при этом сокращается количество двоичных разрядов для полезной информации. В качестве альтернативы можно использовать контроль правдоподобия. Например, если сообщения содержат временную метку, последовательные сообщения должны содержать последовательные временные метки. Если декодированное сообщение имеет метку времени, не соответствующую заданному порядку, такое сообщение может быть исключено.

После корректного распознавания сообщения система может выбрать механизм упреждения и/или возврата. Подразумевается, что достигнута синхронизация как битов, так и сообщений. Подразумевая, что пользователь намеренно не пропускает сообщения, система выполняет "возврат" во времени и делает попытку декодировать предыдущие сообщения (если они уже не декодированы), используя ту же самую точку синхронизации (алгоритм "с возвратом"). Это особенно целесообразно при запуске системы. Кроме того, при неблагоприятных условиях для достижения синхронизации может потребоваться два сообщения. В таком случае у первого сообщения шансы отсутствуют. Благодаря применению алгоритма "с возвратом" можно сохранить "доброкачественные" сообщения, которые не были получены только в силу использования обратной синхронизации. Упреждение - обратная этой функция с обращением в будущее. При наличии сообщения в текущий момент мы знаем, где должно быть очередное сообщение, и в любом случае можем попытаться его декодировать.

3.6. Детализация синхронизации

Для кодирования полезной информации может быть применен, в частности, алгоритм Витерби. На фиг.18A графически отображены полезная нагрузки 1810, конечная последовательность Витерби 1820, полезная нагрузка, закодированная по Витерби 1830, и вариант кодирования полезной нагрузки по Витерби с многократным повторением кодирования 1840. Так, пусть длина полезной нагрузки составляет 34 бита, а конечная последовательность Витерби состоит из 6 битов. Если, предположим, применима скорость кодирования по Витерби 1/7, закодированная по Витерби полезная информация может содержать (34+6)*7=280 битов. Далее, при использовании кодирования с повторениями 1/2, кодированная с повторениями версия 1840 кодированной по Витерби полезной информации 1830 может содержать 280*2=560 битов. В этом примере, если принять, что битовый такт составляет 42,66 мс, длина сообщения составит 23,9 с. Сигнал может быть введен с использованием, допустим, 9 поднесущих (например, локализованных в соответствии с критическими полосами частот) от 1,5 до 6 кГц, как показано на диаграмме частотного спектра на фиг.18B. Как вариант может быть использовано другое количество поднесущих частот (скажем, 4, 6, 12, 15 или между 2 и 20) в диапазоне частот между 0 и 20 кГц.

На фиг.19 схематически представлена базовая концепция 1900 синхронизации, называемой также ABC-синхронизацией. На схеме графически отображены незакодированное сообщение 1910, закодированное сообщение 1920 и последовательность синхронизации (синхропоследовательность) 1930, а также применение синхронизации к нескольким сообщениям 1920, следующим друг за другом.

Последовательность синхронизации или синхропоследовательность, упомянутая в контексте объяснения концепции синхронизации (отображенной на фиг.19-23), может быть идентичной сигнатуре синхронизации, рассмотренной раньше. Далее, на фиг.20 схематически отображена синхронизация путем корреляции с синхропоследовательностью. Если последовательность синхронизации 1930 короче, чем сообщение, в пределах одного сообщения может быть найдено больше одной точки синхронизации 1940 (или временного блока выравнивания). В примере на фиг.20, внутри каждого сообщения определено 4 точки синхронизации. Следовательно, при каждой найденной синхронизации может быть задействован декодер Витерби (последовательность декодирования Витерби). Таким образом, для каждой точки синхронизации 1940 может быть получено сообщение 2110, как показано на фиг.21. Из этих сообщений могут быть выделены истинные сообщения 2210 с помощью последовательности циклического контроля избыточности (последовательности CRC) и/или контроля правдоподобия, как показано на фиг.22. При контроле с применением циклического избыточного кода (при распознавании CRC) может быть использована известная последовательность для дифференциации истинных и ложных сообщений. На фиг.23 графически отображен пример присоединения последовательности CRC к концу полезной информации. Вероятность ложного обнаружения (сообщения, сгенерированного на основе ошибочной точки синхронизации) может зависеть от длины последовательности CRC и количества задействуемых декодеров Витерби (числа точек синхронизации в структуре одного сообщения). Чтобы увеличить длину полезной информации, не повышая вероятность ложного обнаружения, можно применить контроль правдоподобия или увеличить длину последовательности синхронизации (сигнатуры синхронизации).

4. Подходы и преимущества

Далее рассмотрим некоторые аспекты описанной выше системы как признаки новизны. Кроме того, сравним эти аспекты с существующим уровнем техники в данной области.

4.1. Непрерывная синхронизация

Некоторые конструктивные решения предусматривают непрерывную синхронизацию. Сигнал синхронизации (синхросигнал), обозначенный как сигнатура синхронизации, вводят непрерывно и параллельно с данными путем перемножения с последовательностями, обозначенными как последовательности расширения синхронизации, и известными как на передающей, так и на принимающей стороне. В некоторых традиционных системах используют особые символы (отличные от тех, которые используют для данных), в то время как в реализациях заявляемого изобретения подобные специальные символы не используются. Другие классические методы заключаются во введении известной последовательности битов (преамбулы) с временным мультиплексированием относительно данных, или во введении сигнала с частотным мультиплексированием относительно данных.

Однако установлено, что использование выделенных подполос для синхронизации нежелательно, поскольку канал может иметь провалы на этих частотах, что делает синхронизацию ненадежной. По сравнению с другими методами, в которых преамбулу или специальный сигнал мультиплексируют с данными во времени, преимуществом описываемого здесь способа является то, что он позволяет отслеживать изменения в синхронизации (например, вследствие движения) непрерывно.

Более того, энергия сигнала водяного знака не изменяется (например, при введении путем умножения сигнала водяного знака в представление информации о расширении), и синхронизация может быть спроектирована независимо от психоакустической модели и скорости передачи данных. Временная протяженность сигнатуры синхронизации, определяющая устойчивость синхронизации, может быть спроектирована по желанию полностью независимо от скорости обмена данными.

Еще один классический метод заключается во введении последовательности синхронизации с кодовым мультиплексированием относительно данных. По сравнению с этим классическим методом преимущество предлагаемого способа состоит в том, что энергия данных не является интерферирующим фактором при вычислении корреляции, обеспечивая большую робастность. В дополнение к этому, при использовании кодового мультиплексирования количество ортогональных последовательностей, подлежащих синхронизации, уменьшается, поскольку некоторые из них необходимы для данных.

Исходя из сказанного, подход непрерывной синхронизации, описываемый здесь, обеспечивает целый ряд преимуществ перед общепринятыми алгоритмами.

Тем не менее, в некоторых аппаратных версиях представленного изобретения приложима какая-либо иная концепция синхронизации.

4.2. Двухмерное расширение

Некоторые технические решения предложенной системы выполняют расширение как во временной, так и в частотную области, то есть двухмерное расширение (кратко 2D-расширение). Как установлено, оно дает преимущества по сравнению с 1D-системами, поскольку частота передачи ошибочных битов может быть еще более сокращена за счет введения избыточности, например, во временной области.

Между тем, некоторые реализации заявляемого изобретения допускают применение какого-либо иного метода расширения.

4.3. Дифференциальное кодирование и дифференциальное декодирование

В некоторых реализациях устойчивость к движению и частотному рассогласованию гетеродинов (в отличие от традиционных систем) обеспечивается дифференциальной модуляцией. Подтвержден факт, что эффект Доплера (движение / перемещение) и частотные рассогласования приводят к ротации констелляции (стереометрического взаиморасположения) двоичной (/двухпозиционной) фазовой манипуляции ДФМн (BPSK) (иными словами, к вращению в комплексной битовой плоскости). В некоторых реализациях вредные воздействия такой ротации констелляции ДФМн (или констелляции любой другой соответствующей модуляции) предотвращают путем использования дифференциального (разностного) кодирования или дифференциального декодирования.

В то же время, некоторые версии осуществления данного изобретения допускают привлечение какого-либо другого алгоритма кодирования или алгоритма декодирования. Более того, в некоторых случаях дифференциальное кодирование может быть исключено.

4.4. Формирование бита

Некоторые технические решения заявляемого изобретения предусматривают значительное улучшение рабочих характеристик системы и надежности распознавания за счет применения фильтра формирования бита. Согласно таким техническим решениям использование формирования бита повышает надежность маркировки водяными знаками. Было определено, что особенно положительные результаты могут быть получены, если функция формирования бита имеет большую длину, чем межбитовый интервал. Однако в некоторых вариантах реализации может быть применена отличная от данной концепция формирования бита. Более того, в некоторых случаях, формирование бита может не выполняться.

4.5. Интерактивный синтез блока психоакустического моделирования (PAM) и банка фильтров (FB).

Некоторые аппаратные версии предусматривают взаимодействие блока психоакустического моделирования с модулятором для тонкой настройки амплитуд, умножающих биты. При этом в других версиях конструкции такое взаимодействие может быть исключено.

4.6. Функции упреждения и возврата

Некоторые технические решения предусматривают так называемые функции "возврата" и "упреждения". Ниже дан краткий обзор этих концепций. Если сообщение декодировано корректно, подразумевается, что синхронизация была выполнена успешно. При допущении, что пользователь не очищает память, некоторые аппаратные версии выполняют возврат во времени и осуществляют попытку декодировать предшествующие сообщения (если они еще не декодированы), используя ту же самую точку синхронизации (функция "взгляд назад"). Это особенно целесообразно при запуске системы. В худших ситуациях для достижения синхронизации может потребоваться 2 сообщения. В подобном случае в традиционных системах у первого сообщения шансов нет. В вариантах компоновки изобретения с опцией возврата предусматривается возможность сохранять (или декодировать) "хорошие" сообщения, которые не были получены только из-за обратной синхронизации. Упреждение - обратная этой функция с обращением в будущее. Если сейчас у меня есть сообщение, то я знаю, где должно быть мое следующее сообщение и могу сделать попытку декодировать его каким-либо образом. Таким образом, перекрывание сообщений позволяет декодировать их. Однако при реализации изобретения в некоторых случаях функция упреждения и/или функция возврата может быть исключена.

4.7. Повышение надежности синхронизации

В некоторых версиях исполнения для формирования устойчивого синхросигнала синхронизацию выполняют в режиме неполного сообщения с короткими сигнатурами синхронизации. Для этого необходим большой объем декодирования, что увеличивает риск распознавания ложно-значимых сообщений. Для предотвращения этого явления в некоторых реализациях в сообщения вставляют сигнальные последовательности, что приводит к более низкому битрейту. Однако при реализации изобретения к оптимизации надежности синхронизации возможен альтернативный подход. Более того, в некоторых случаях можно не применять никакие методики повышения надежности синхронизации.

4.8. Другие усовершенствования

Перейдем к выборочному рассмотрению ряда возможных усовершенствований описанной выше системы по сравнению с известным уровнем техники:

1) более низкая вычислительная трудоемкость;

2) улучшенное качество восприятия благодаря улучшенной психоакустической модели;

3) повышенная ошибкоустойчивость в реверберирующих средах благодаря узкополосным мультинесущим сигналам;

4) исключение в некоторых реализациях оценивания отношения сигнал-шум (SNR). Обеспечение за счет этого лучшей устойчивости, особенно в режимах низкого SNR.

Некоторые варианты исполнения изобретения превосходят общепринятые системы, в которых используются очень узкие полосы, например, 8 Гц, в силу таких причин, как:

1) полоса 8 Гц (или подобная очень узкая полоса частот) требует весьма длинных временных символов, поскольку в психоакустической модели выделена очень малая энергия для обеспечения ее неслышности;

2) 8 Гц (или подобная очень узкая полоса) становится ощутимой в рамках зависимости от изменяющихся во времени спектров доплеровских частот. В силу этого такая узкополосная система обычно не вполне удовлетворяет техническим требованиям реализации, допустим, в часах.

Некоторые варианты технического решения изобретения опережают другие технологии в силу приведенных низе причин.

1. Технологии, вносящие эхо, сбоят в реверберирующих пространственных объемах. В отличие от них конструктивные решения согласно изобретению направлены на устранение возможности внесения эха.

2. Технологии, использующие только расширение по времени, содержат более продолжительное сообщение по сравнению с конструкциями описанной выше системы, в которой применено двухмерное расширение, например, по времени и по частоте одновременно.

Конструктивные решения по настоящему изобретению превосходят систему, описанную в DE 19640814, поскольку присущие ей один или более недостатков, перечисленных ниже, в них преодолены:

- чрезмерная сложность декодера системы по DE 19640814, где применен фильтр длиной 2N при N=128;

- чрезмерная длительность сообщения системы по DE 19640814;

- расширение в системе по DE 19640814 выполняется только во временной области при относительно высоком приращении (например, 128);

- чрезмерная сложность системы по DE 19640814, где сигнал генерируется во временной области, преобразуется в спектральную область, взвешивается, преобразуется обратно во временную область и накладывается на аудиоконтент.

5. Назначение

Данное изобретение включает в себя способ модификации аудиосигнала для скрытия цифровых данных и соответствующий декодер, выполненный с возможностью поиска и извлечения таких данных с сохранением у модифицированного сигнала оригинального акустического качества.

Далее приведены примеры возможных сфер приложения изобретения.

1. Мониторинг эфирного вещания: водяной знак, содержащий информацию, например, о станции и времени, скрыт в аудиосигнале радио или телевизионных программ. Декодеры, встроенные в небольшие устройства, закрепленные за субъектами тестирования, распознают водяной знак и таким образом собирают ценную информацию для рекламных агентств, в частности, кто смотрел какую программу и когда.

2. Аудит (ревизование): водяной знак может быть скрыт, например, в рекламных объявлениях. Ведя автоматический мониторинг передач определенной станции, можно в последующем узнать, когда точно реклама была дана в эфир. Аналогичным способом можно выбрать статистику по вещанию различных станций, например, частоту звучания в эфире определенной музыкальной пьесы, и т.п.

3. Включение метаданных: предложенный способ предусматривает возможность вводить скрытые цифровые данные музыкального произведения или программы, например, название и автора пьесы или продолжительность программы и т.д.

6. Альтернативные конструктивные решения

Несмотря на то, что здесь в основном рассматривается оборудование с точки зрения его технического устройства, понятно, что аспекты материальной части тесно связаны с описанием соответствующих способов ее применения, и какое-либо изделие или блок соответствуют особенностям метода или технологической операции.

Аналогично, рассматриваемые технологии и рабочие операции непосредственно связаны с соответствующим машинным оборудованием и его элементной базой.

Некоторые или все шаги предлагаемого способа могут быть выполнены с использованием аппаратных средств, таких, например, как микропроцессор, программируемый компьютер или электронная схема. В некоторых случаях осуществления одна или больше ответственных операций, составляющих данный способ, могут быть выполнены таким устройством.

Относящийся к изобретению кодированный сигнал водяного знака или аудиосигнал, в который внедрен сигнал водяного знака, могут храниться на цифровом накопителе информации или могут быть переданы в транслирующую среду, такую как беспроводное вещание или проводная связь, например Интернет.

В зависимости от конечного назначения и особенностей практического применения изобретение может быть реализовано в аппаратных или программных средствах.

В реализации могу быть применены такие цифровые носители информации, как гибкий диск, DVD, "Блю-рей", CD, ПЗУ, ППЗУ, программируемое ПЗУ, СППЗУ или ФЛЭШ-память, содержащие электронно-считываемые управляющие сигналы, которые взаимодействуют (или совместимы) с программируемой компьютерной системой таким образом, что предлагаемый способ может быть осуществлен. Следовательно, цифровая среда хранения данных может быть читаемой компьютером.

Некоторые варианты конструкции согласно данному изобретению имеют в своем составе носитель информации, содержащий электронно считываемые сигналы управления, совместимый с программируемой компьютерной системой и способный участвовать в реализации одного из описанных здесь способов.

В целом данное изобретение может быть реализовано как компьютерный программный продукт с кодом программы, обеспечивающим осуществление одного из предлагаемых способов при условии, что компьютерный программный продукт используется с применением компьютера. Код программы может, например, храниться на машиночитаемом носителе.

Различные варианты реализации включают в себя компьютерную программу, хранящуюся на машиночитаемом носителе, для осуществления одного из описанных здесь способов.

Таким образом, формулируя иначе, относящийся к изобретению способ осуществляется с помощью компьютерной программы, имеющей код программы, обеспечивающий реализацию одного из описанных здесь способов, если компьютерную программу выполняют с использованием компьютера.

Далее, следовательно, техническое исполнение изобретенного способа включает в себя носитель данных (либо цифровой накопитель информации, либо читаемую компьютером среду), содержащий записанную на нем компьютерную программу, предназначенную для осуществления одного из способов, описанных здесь.

Отсюда следует, что реализация изобретения подразумевает наличие потока данных или последовательности сигналов, представляющих компьютерную программу для осуществления одного из описанных здесь способов. Поток данных или последовательность сигналов могут быть рассчитаны на передачу через средства связи, например, Интернет.

Кроме того, реализация включает в себя аппаратные средства, например, компьютер или программируемое логическое устройство, предназначенные или приспособленные для осуществления одного из описанных здесь способов.

Далее, для технического исполнения требуется компьютер с установленной на нем компьютерной программой для осуществления одного из описанных здесь способов.

Некоторые версии конструкции для реализации одной или всех функциональных возможностей описанных здесь способов могут потребовать применения программируемого логического устройства (например, полевой программируемой матрицы логических элементов). В зависимости от назначения версии базовый матричный кристалл может сочетаться с микропроцессором с целью осуществления одного из описанных здесь способов. Как правило, описываемые способы могут быть реализованы с использованием любого аппаратного средства.

Описанные выше конструктивные решения являются только иллюстрациями основных принципов настоящего изобретения. Подразумевается, что для специалистов в данной области возможность внесения изменений и усовершенствований в компоновку и элементы описанной конструкции очевидна. В силу этого, представленные здесь описания и пояснения вариантов реализации изобретения ограничиваются только рамками патентных требований, а не конкретными деталями.

1. Генератор водяного знака (101; 2400), вырабатывающий сигнал цифрового водяного знака (101b; 2420), исходя из данных двоичного сообщения (101а, m; 2410), включающий процессор информации (303, 304, 305; 2430), предназначенный для формирования на основе информационных единиц данных двоичного сообщения первого время-частотного представления (b(i,j); 2432), значения которого отображают данные двоичного сообщения; и дифференциальный кодер (306; 2440), предназначенный для формирования второго время-частотного представления (306а, b_diff(i, j); 2442) на основе первого время-частотного представления таким образом, что второе время-частотное представление содержит множество значений, разность двух из которых (b_diff(i, j), b_diff(i, j-1)) выражает соответствующее значение первого время-частотного представления, для выполнения дифференциального кодирования значений первого время-частотного представления; и провайдер сигнала водяного знака (307; 2450), настроенный на предоставление сигнала водяного знака на базе второго время-частотного представления.

2. Генератор водяного знака по п. 1, в котором процессор информации формирует первое время-частотное представление таким образом, что значения первого время-частотного представления отображают данные двоичного сообщения в форме двоичного шаблона расширения; и дифференциальный кодер формирует второе время-частотное представление таким образом, что между двумя последовательными значениями второго время-частотного представления отражается фазовый переход, если соответствующее значение первого время-частотного представления принимает первое значение, и таким образом, что между двумя последовательными значениями второго время-частотного представления фазовый переход отсутствует, если соответствующее значение первого время-частотного представления принимает второе значение, отличное от первого значения.

3. Генератор водяного знака по п. 2, в котором процессор информации вычисляет битовое значение b_diff(i, j), относящееся к частотной полосе i и временному блоку второго время-частотного представления j таким образом, что b_diff(i, j)=b_diff(i, j-1)·b(i, j), где b_diff(i, j-1) обозначает битовое значение, относящееся к частотной полосе i и временному блоку второго время-частотного представления j; где b(i,j) обозначает битовое значение, относящееся к частотной полосе i и временному блоку первого время-частотного представления j; и где двоичные состояния первого время-частотного представления выражены значениями +1 и -1.

4. Генератор водяного знака по п. 1, в котором провайдер сигнала водяного знака генерирует совмещенный аудиосигнал (107) на базе второго время-частотного представления таким образом, что составляющая водяного знака сигнала с водяным знаком содержит ступенчатый или плавный фазовый переход как отклик на первое значение первого время-частотного представления, и таким образом, что частотная составляющая водяного знака сигнала с водяным знаком содержит фазовую постоянную как отклик на второе значение первого время-частотного представления, отличающегося от первого значения.

5. Генератор водяного знака по п. 1, в котором провайдер сигнала водяного знака вырабатывает первую форму сигнала, задающую форму бита (g_i ^T(t)), как отклик на первое значение второго время-частотного представления и вырабатывает вторую форму сигнала, задающую форму бита (-g_i ^T(t)), как отклик на второе значение второго время-частотного представления и в котором провайдер сигнала водяного знака вводит в сигнал водяного знака взвешенную или невзвешенную суперпозицию сдвинутых во времени версий одной и той же формы сигнала, задающего форму бита, как отклик на наличие первого значения в первом время-частотном представлении и вводит в сигнал водяного знака взвешенную или невзвешенную суперпозицию сдвинутых во времени версий первой формы сигнала, задающего форму бита, и второй формы сигнала, задающего форму бита, как отклик на наличие второго значения, отличного от первого значения, в первом время-частотном представлении.

6. Генератор водяного знака по п. 5, в котором вторая форма сигнала, задающего форму бита, представляет собой инверсию первой формы сигнала, задающего форму бита.

7. Декодер водяного знака (200; 2500), формирующий данные двоичного сообщения (202а; 2520), исходя из сигнала, маркированного водяным знаком (200а; 2510), включающий в свою схему: блок формирования время-частотного представления (1600; 2530), формирующий первое представление сигнала с водяным знаком во время-частотной области (b_i ^norm(j); 2532); дифференциальный декодер (1608; 2540), формирующий второе время-частотное представление (; 2542) на основе первого время-частотного представления таким образом, что значения второго время-частотного представления зависят от разностей фаз двух соответствующих значений (b_i ^norm(j), b_i ^norm(j-1) первого время-частотного представления; и детектор синхронизации (201; 2550), формирующий данные синхронизации (205; 2552) на основе второго время-частотного представления; и экстрактор водяного знака (202; 2560), извлекающий данные двоичного сообщения из первого представления сигнала с водяным знаком во время-частотной области или из второго представления сигнала с водяным знаком во время-частотной области с использованием данных синхронизации.

8. Декодер водяного знака (200; 2600), формирующий данные двоичного сообщения (202а; 2620) на основе сигнала с водяным знаком (200а; 2610), включающий в свою схему: блок формирования время-частотного представления (1600; 2630), вырабатывающий первое представление сигнала с водяным знаком во время-частотной области (b_i ^norm(j); 2632); дифференциальный декодер (1608; 2640), вырабатывающий второе представление во время-частотной области (; 2542) на основе первого представления во время-частотной области таким образом, что значения второго время-частотного представления зависят от разностей фаз двух соответствующих значений (b_i ^norm(j), b_i ^norm(j-1) первого время-частотного представления; и экстрактор водяного знака (202; 2650), извлекающий данные двоичного сообщения из второго время-частотного представления.

9. Декодер водяного знака по п. 7, в котором блок формирования время-частотного представления выводит для множества полос частот и для множества интервалов времени гибкие битовые коэффициенты (b_i ^AFB(j), b_i ^norm(j)), описывающие амплитуду и фазу сигнала с водяным знаком в соответствующих полосах частот и интервалах времени; и в котором дифференциальный декодер вычисляет значение () второго время-частотного представления, относящегося к данной частотной полосе (f_i) и данному интервалу времени (j), на основе двух соответствующих значений b_i ^norm(j), b_i ^norm(j-1) первого время-частотного представления.

10. Декодер водяного знака по п. 7, включающий фильтр анализа (1600), который предназначен для выполнения свертки сигнала с водяным знаком или его микшированной с понижением версии с использованием первой функции формирования бита (g_i ^R(t)); и предусматривающий временную дискретизацию результата свертки с получением дискретных значений времени первого время-частотного представления; и причем декодер водяного знака реализован с возможностью подстройки тактовой частоты, использованной при дискретизации результата свертки, по разрешению субразрядного интервала в соответствии с данными синхронизации для приведения к максимальному значению отношения сигнал-шум и минимизации коэффициента взаимного влияния символов.

11. Декодер водяного знака по п. 7, в котором дифференциальный декодер выводит второе время-частотное представление независимо для каждой частотной полосы (f_i) таким образом, что вращения разных фаз сигнала с водяным знаком в разных полосах частот компенсируются независимо; и в котором детектор синхронизации или декодер водяного знака совокупно обрабатывает ряд значений время-частотного представления фрагмента отдельного интервала времени, включающего в себя различные полосы частот, вырабатывая данные синхронизации или бит данных двоичного сообщения.

12. Портативное устройство распознавания водяного знака (2700), включающее микрофон (2710), генерирующий электрический микрофонный сигнал (2712); и декодер водяного знака (2720) по одному из пп. 7-11, принимающий сигнал микрофона как сигнал, маркированный водяным знаком.

13. Способ (2800) генерации сигнала водяного знака на основе данных двоичного сообщения, включающий формирование (2810), исходя из информационных единиц данных двоичного сообщения, первого время-частотного представления, значения которого отображают данные двоичного сообщения; формирование (2820) на основе первого время-частотного представления второго время-частотного представления, содержащего множество значений, разность двух из которых выражает соответствующее значение первого время-частотного представления, для выполнения дифференциального кодирования значений первого время-частотного представления; и генерацию (2830) сигнала водяного знака на базе второго время-частотного представления.

14. Способ (2900) формирования данных двоичного сообщения на основе сигнала с водяным знаком, включающий формирование (2910) первого представления сигнала с водяным знаком во время-частотной области; формирование (2920) второго время-частотного представления, исходя из первого время-частотного представления, таким образом, что значения второго время-частотного представления зависят от разностей фаз двух соответствующих значений первого время-частотного представления; и использование (2930) второго время-частотного представления с выведением данных синхронизации для формирования данных двоичного сообщения или для извлечения данных двоичного сообщения из сигнала с водяным знаком.

15. Машиночитаемый носитель, содержащий компьютерную программу, предназначенную для осуществления способа по п. 13 при условии ее выполнения на компьютере.

16. Машиночитаемый носитель, содержащий компьютерную программу, предназначенную для осуществления способа по п. 14 при условии ее выполнения на компьютере.

17. Генератор водяного знака (101; 2400), вырабатывающий сигнал водяного знака (101b; 2420), исходя из данных двоичного сообщения (101а, m; 2410), включающий в свою схему: процессор информации (303, 304, 305; 2430), выполняющий расширение данных двоичного сообщения на множество частотных полос или частотных подполос и формирующий, исходя из информационных единиц данных двоичного сообщения, первое время-частотное представление (b(i, j); 2432), значения которого отображают данные двоичного сообщения для множества частотных полос или частотных подполос и временных блоков; и дифференциальный кодер (306; 2440), формирующий второе время-частотное представление (306a, b_diff(i, j); 2442) на основе первого время-частотного представления таким образом, что второе время-частотное представление содержит множество значений, где значение b_diff(i, j) второго время-частотного представления является функцией значения b_diff(i, j-1) второго время-частотного представления и значения b(i,j) первого время-частотного представления и где разность двух значений b_diff(i, j), b_diff(i, j-1) второго время-частотного представления выражает соответствующее значение первого время-частотного представления, для выполнения дифференциального кодирования значений первого время-частотного представления; и провайдер сигнала водяного знака (307; 2450), настроенный на предоставление сигнала водяного знака на базе второго время-частотного представления.

18. Декодер водяного знака (200; 2500), формирующий данные двоичного сообщения (202а; 2520), исходя из сигнала, маркированного водяным знаком (200а; 2510), включающий в свою схему: блок формирования время-частотного представления (1600; 2530), выводящий первое представление сигнала с водяным знаком во время-частотной области (b_i ^norm(j); 2532), где значения b_i ^norm(j) первого время-частотного представления содержат информацию о фазе составляющих сигнала на частоте f_i и в момент времени j; дифференциальный декодер (1608; 2540), формирующий второе время-частотное представление (; 2542) на основе первого время-частотного представления таким образом, что значения второго время-частотного представления зависят от разностей фаз двух соответствующих значений b_i ^norm(j), b_i ^norm(j-1) первого время-частотного представления; и детектор синхронизации (201; 2550), выводящий данные синхронизации (205; 2552) из второго время-частотного представления; и экстрактор водяного знака (202; 2560), предназначенный для извлечения данных двоичного сообщения из первого представления сигнала с водяным знаком во время-частотной области или из второго представления сигнала с водяным знаком во время-частотной области с использованием данных синхронизации.

19. Декодер водяного знака (200; 2600), формирующий данные двоичного сообщения (202а; 2620) на основе сигнала с водяным знаком (200а; 2610), включающий в свою схему: блок формирования время-частотного представления (1600; 2630), выводящий первое представление сигнала с водяным знаком во время-частотной области (b_i ^norm(j); 2632), где значения b_i ^norm(j) первого время-частотного представления содержат информацию о фазе составляющих сигнала на частоте f_i и в момент времени j; дифференциальный декодер (1608; 2640), формирующий второе время-частотное представление (; 2542) на основе первого время-частотного представления таким образом, что значения второго время-частотного представления зависят от разностей фаз двух соответствующих значений (b_i ^norm(j), b_i ^norm(j-1)) первого время-частотного представления; и экстрактор водяного знака (202; 2650), предназначенный для извлечения данных двоичного сообщения из второго время-частотного представления.

20. Способ (2800) генерации сигнала водяного знака на основе данных двоичного сообщения, включающий в себя: расширение данных двоичного сообщения на множество частотных полос или частотных подполос с формированием (2810), исходя из информационных единиц данных двоичного сообщения, первого время-частотного представления, значения которого отображают данные двоичного сообщения для множества частотных полос или частотных подполос и временных блоков; формирование (2820) второго время-частотного представления на основе первого время-частотного представления таким образом, что второе время-частотное представление содержит множество значений, где значение b_diff(i, j) второго время-частотного представления является функцией значения b_diff(i, j-1) второго время-частотного представления и значения b(i, j) первого время-частотного представления и где разность двух значений второго время-частотного представления выражает соответствующее значение первого время-частотного представления, для выполнения дифференциального кодирования значений первого время-частотного представления; и генерацию (2830) сигнала водяного знака на базе второго время-частотного представления.

21. Способ (2900) формирования данных двоичного сообщения на основе сигнала с водяным знаком, включающий в себя: формирование (2910) первого представления сигнала с водяным знаком во время-частотной области, где значения b_i ^norm(j) первого время-частотного представления содержат информацию о фазе составляющих сигнала на частоте f_i и в момент времени j; формирование (2920) второго время-частотного представления, исходя из первого время-частотного представления, таким образом, что значения второго время-частотного представления зависят от разностей фаз двух соответствующих значений первого время-частотного представления; и использование (2930) второго время-частотного представления с выведением данных синхронизации для формирования данных двоичного сообщения или для извлечения данных двоичного сообщения из сигнала с водяным знаком.

22. Машиночитаемый носитель, содержащий компьютерную программу, предназначенную для осуществления способа по п. 20 при условии ее выполнения на компьютере.

23. Машиночитаемый носитель, содержащий компьютерную программу, предназначенную для осуществления способа по п. 21 при условии ее выполнения на компьютере.

Изобретение относится к области обработки звука, а именно к области параметрического пространственного преобразования звука с трансформацией первого параметрического пространственного аудиосигнала во второй параметрический пространственный аудиосигнал.

Многорежимный аудио кодировщик и celp кодирование, адаптированное к нему // 2586841

Изобретение относится к вычислительной технике. Технический результат заключается в обеспечении регулировки общего усиления без декодирования и дополнительного этапа повторного кодирования.

Аудиокодек, использующий синтез шума в течение неактивной фазы // 2586838

Изобретение относится к аудиокодеку, поддерживающему синтез шума в течение неактивных фаз. Техническим результатом является уменьшение скорости передачи битов с поддержанием достижимого качества формирования шума.

Кодирование и декодирование позиций импульсов дорожек аудиосигнала // 2586597

Изобретение относится к средствам кодирования и декодирования закодированного аудиосигнала. Технический результат заключается в обеспечении кодирования и декодирования информации импульсов с использованием меньшего количества битов для представления информации импульсов, что обеспечит возможность уменьшения скорости передачи соответствующим образом закодированного аудиосигнала.

Генерирование шума в аудиокодеках // 2585999

Изобретение относится к средствам генерирования шума в аудиокодеках. Технический результат заключается в обеспечении уменьшения скорости передачи битов и в повышении качества генерируемого шума.

Устройство и способ обработки речевого/аудио сигнала // 2585987

Изобретение относится к средствам обработки речевого/аудио сигнала. Технический результат заключается в обеспечении комфортного воспроизведения звука во время переключения полосы пропускания речевых/аудио сигналов.

Кодирование звука с малой задержкой, содержащее чередующиеся предсказательное кодирование и кодирование с преобразованием // 2584463

Изобретение относится к средствам кодирования цифрового звукового сигнала. Технический результат заключается в сокращении количества бит, необходимого для передачи закодированного сигнала без изменения качества кодирования.

Способ и система кодирования аудиоданных с адаптивной низкочастотной коррекцией // 2583717

Изобретение относится к вычислительной технике. Технический результат заключается в адаптивном применении низкочастотной коррекции в ходе кодирования звуковых сигналов, содержащих выраженные низкочастотные тональные составляющие, без изменения декодера.

Гибридное кодирование многоканального звука // 2581782

Изобретение относится к средствам кодирования и декодирования многоканального звукового сигнала. Технический результат заключается в повышении качества кодированного сигнала.

Способ (варианты) фильтрации зашумленного речевого сигнала в условиях сложной помеховой обстановки // 2580796

Изобретения относятся к области цифровой связи и технологиям обработки речи в условиях зашумления. Технический результат заключается в повышении отношения сигнал-шум очищенного речевого сигнала.

Декодер водяного знака и способ формирования данных двоичного сообщения // 2586845

Изобретение относится к средствам передачи данных двоичного сообщения. Технический результат заключается в оптимизации формирования данных двоичного сообщения в зависимости от сигнала, маркированного водяным знаком, которое позволило бы увеличить объем данных двоичного сообщения, получаемых с сигналом с водяным знаком. Декодер водяного знака, в схему которого введены блок формирования время-частотного представления, блок памяти, детектор синхронизации и экстрактор водяного знака. Блок формирования время-частотного представления создает представление сигнала с водяным знаком в частотной области для множества временных блоков. Блок памяти сохраняет представление сигнала с водяным знаком в частотной области для множества временных блоков. Детектор синхронизации идентифицирует временной блок совмещения на основе частотного представления сигнала с водяным знаком в множестве временных блоков. Экстрактор водяного знака извлекает данные двоичного сообщения из хранящихся в памяти частотных представлений сигнала с водяным знаком во временных блоках, предшествующих идентифицированному временному блоку совмещения, с учетом удаленности от идентифицированного временного блока совмещения. 5 н. и 7 з.п. ф-лы, 39 ил.

Декодер звукового сигнала, кодирующее устройство звукового сигнала, способы и компьютерная программа, использующие зависящее от частоты выборки кодирование контура деформации времени // 2586848

Изобретение относится к средствам кодирования и декодирования звукового сигнала. Технический результат заключается в повышении эффективности кодирования. Декодер звукового сигнала, сформированный для обеспечения декодированного представления звукового сигнала на основе кодированного представления звукового сигнала, включающего информацию о частоте дискретизации, кодированную информацию о деформации времени и кодированное представление спектра, включает вычислитель деформации времени и декодер деформации. Вычислитель деформации времени формируется, чтобы адаптировать правило отображения для отображения кодовых слов кодированной информации о деформации времени на декодированных значениях деформации времени, описывающих декодированную информацию о деформации времени в зависимости от информации о частоте дискретизации. Декодер деформации, сформированный, чтобы обеспечить декодированное представление звукового сигнала на основе кодированного представления спектра и в зависимости от декодированной информации о деформации времени. 6 н. и 11 з.п. ф-лы, 35 ил.

Устройство для формирования улучшенного сигнала микширования с понижением, способ формирования улучшенного сигнала микширования с понижением и компьютерная программа // 2586851

Изобретение относится к технике связи. Технический результат - обеспечение формирования улучшенного сигнала микширования с понижением. Устройство для формирования улучшенного сигнала микширования с понижением на основе многоканального микрофонного сигнала включает пространственный анализатор, выполненный с возможностью вычислить ряд пространственных параметров звука, включающих информацию о направлении, описывающую направление прибытия прямого звука, информацию о мощности прямого звука и информацию о мощности диффузного звука на основе многоканального микрофонного сигнала. Устройство также включает калькулятор фильтра для того, чтобы вычислить параметры фильтра расширения в зависимости от информации о направлении, описывающей направление прибытия прямого звука, информации о мощности прямого звука и информации о мощности диффузного звука. Устройство также включает фильтр для того, чтобы фильтровать микрофонный сигнал или сигнал, полученный из микрофонного сигнала, используя параметры фильтра расширения, чтобы получить улучшенный сигнал микширования с понижением. 6 н. и 12 з.п. ф-лы, 7 ил.

Устройство, способ и компьютерная программа для устранения артефактов амплитудного ограничения // 2586874

Изобретение относится к технологиям кодирования/декодирования аудиоинформации. Техническим результатом является обеспечение понижения амплитудных ограничений. Предложено устройство кодирования аудиоинформации. Устройство содержит кодер для кодирования временного фрагмента входного аудиосигнала, подлежащего кодированию, для получения соответствующего кодированного фрагмента сигнала. Устройство кодирования аудиоинформации дополнительно содержит декодер для декодирования кодированного фрагмента сигнала для получения повторно декодированного фрагмента сигнала. Устройство обнаружения амплитудного ограничения предусмотрено для анализа повторно декодированного фрагмента сигнала относительно по меньшей мере одного из фактического амплитудного ограничения сигнала или перцепционного амплитудного ограничения сигнала и для генерирования соответствующего предупреждения об амплитудном ограничении. Кодер дополнительно выполнен с возможностью повторного кодирования временного фрагмента аудиосигнала по меньшей мере с одним измененным параметром кодирования, приводящим к пониженной вероятности амплитудного ограничения, в ответ на предупреждение об амплитудном ограничении. 3 н. и 25 з.п. ф-лы, 5 ил.

Устройство формирования водяных знаков, устройство декодирования водяных знаков, способ обеспечения сигнала с водяным знаком на основе данных, содержащих дискретные значения, и способ обеспечения данных, содержащих дискретные значения, в зависимости от сигнала с водяным знаком // 2586877

Изобретение относится к системе связи и предназначено для формирования водяных знаков для обеспечения сигнала с водяным знаком на основе данных, содержащих дискретные значения. Технический результат - повышение устойчивости сигнала водяного знака. Устройство содержит устройство дифференциального кодирования, выполненное с возможностью применения чередования фаз к текущему потоковому значению из потоковых значений или к текущему символу водяного знака, причем текущий символ водяного знака соответствует текущему потоковому значению из потоковых значений, чтобы получить текущий коэффициент водяного знака сигнала водяного знака. Устройство дифференциального кодирования выполнено с возможностью извлечения фазы предыдущего спектрального коэффициента сигнала с водяным знаком, который является объединением главного сигнала и сигнала водяного знака, также выполнено с дополнительной возможностью обеспечения сигнала водяного знака, такого, что фазовый угол чередования фаз, применяемый к текущему потоковому значению или к текущему символу водяного знака, зависит от фазы предыдущего спектрального коэффициента сигнала с водяным знаком. 5 н. и 10 з.п. ф-лы, 16 ил.

Аудиокодер и аудиодекодер с метаданными громкости и границы программы // 2589362

Изобретение относится к средствам кодирования и декодирования аудиоданных. Технический результат заключается в повышении эффективности обработки аудиоданных. Кодированный битовый аудиопоток содержит аудиоданные и контейнер метаданных, причем контейнер метаданных включает заголовок, одну или несколько полезных нагрузок метаданных и защитные данные. Синтаксический анализатор, соединенный с аудиодекодером или интегрированный в него предназначен для выполнения синтаксического анализа кодированного битового аудиопотока. Заголовок содержит синхрослово, идентифицирующее начало контейнера метаданных, одна или несколько полезных нагрузок метаданных описывают аудиопрограмму, связанную с аудиоданными, защитные данные расположены после одной или нескольких полезных нагрузок метаданных, защитные данные имеют возможность быть использованными для проверки целостности контейнера метаданных и одной или нескольких полезных нагрузок в контейнере метаданных. 2 н. и 21 з.п. ф-лы, 2 табл., 11 ил.

Аудиокодер и аудиодекодер с метаданными сведений о программе или структуры вложенных потоков // 2589370

Изобретение относится к средствам генерирования кодированного битового аудиопотока, которое заключается во включении в битовый поток метаданных структуры вложенных потоков и/или метаданных сведений о программе и аудиоданных. Технический результат заключается в повышении качества генерируемых аудиоданных. Модуль обработки аудиоданных содержит подсистему обработки данных, связанную с указанной буферной памятью. Буферная память хранит один кадр кодированного битового аудиопотока, и указанный кадр содержит метаданные сведений о программе или метаданные структуры вложенных потоков в одном сегменте метаданных одного поля игнорируемых данных этого кадра и аудиоданные - в еще одном сегменте этого кадра. Указанная подсистема обработки данных выполнена с возможностью выполнения следующих операций: генерирования битового потока, декодирования битового потока или адаптивной обработки аудиоданных битового потока с использованием метаданных этого битового потока, или следующих операций: аутентификации, проверки достоверности аудиоданных или метаданных битового потока с использованием метаданных этого битового потока. Указанный сегмент метаданных содержит одну полезную нагрузку метаданных. 2 н. и 20 з.п. ф-лы, 8 ил., 2 табл.

Расположение элемента кадра в кадрах потока битов, представляющего аудио содержимое // 2589399

Изобретение относится к области кодирования. Технический результат - обеспечение компромисса между слишком высоким потоком битов и расходами на декодирование. Цифровой носитель данных имеет сохраненные на нем данные, для выполнения способа позиционирования элемента кадра, причем данные представляют поток битов, содержащий: блок конфигурации и последовательность кадров, соответственно представляющие последовательные периоды времени аудио содержимого, при этом блок конфигурации, содержит поле, указывающее количество N элементов в кадре на кадр, и часть синтаксиса индикации типа, указывающую, для каждой позиции элемента для последовательности из N позиций элемента, тип элемента из множества типов элемента; и при этом каждый кадр из последовательности кадров содержит последовательность из N элементов кадра, в которой каждый элемент кадра имеет тип элемента, указанный частью синтаксиса индикации типа, для соответствующей позиции элемента, в которой соответствующий элемент кадра позиционирован в последовательности из N элементов кадра соответствующего кадра в потоке битов. 7 н. и 21 з.п. ф-лы, 39 ил., 16 табл.

Кодер аудиосигнала, декодер аудиосигнала, способ кодирования или декодирования аудиосигнала с удалением алиасинга (наложения спектров) // 2591011

Группа изобретений относится к устройствам и способам кодирования и декодирования аудиосигнала с удалением алиасинга (наложения спектров). Техническим результатом является нейтрализация артефактов алиасинга при прохождении через декодер аудиосигнала. Способ включает этапы: преобразования из временной области в частотную область представления входных звуковых данных с формированием в частотной области представления аудиоконтента; формирования спектра частотного представления аудиоконтента или его предварительно обработанной модификации в зависимости от набора параметров области линейного предсказания для фрагмента аудиоконтента, кодируемого в области линейного предсказания, с получением частотного представления аудиоконтента, рассчитанного по форме спектра; и формирования представления сигнала стимуляции антиалиасинга с получением в результате фильтрации сигнала стимуляции антиалиасинга при учете, по меньшей мере, некоторого множества параметров области линейного предсказания сигнала безалиасингового синтеза с нейтрализацией артефактов наложения спектров (алиасинга) на стороне аудиодекодера. 6 н. и 12 з.п. ф-лы, 25 ил., 8 табл.

Устройство и способ обработки переходных процессов для аудио сигналов с изменением скорости воспроизведения или высоты тона // 2591012

Изобретение относится к средствам для обработки аудио сигнала. Технический результат заключается в уменьшении влияния переходных процессов на качество звука. Устройство включает манипулятор времени для индивидуальной обработки во времени множества поддиапазонов звукового сигнала. Манипулятор времени состоит из этапа перекрытия и суммирования для перекрытия и суммирования блоков, по крайней мере, одного из множества сигналов поддиапазонов с использованием значения перекрытия и суммирования, которое отличается от улучшенного значения в модуле извлечения, детектора переходных процессов для обнаружения переходного процесса в звуковом сигнале или поддиапазонах сигнала, и множества сумматоров переходных процессов для сложения обнаруженных переходных процессов с множеством сигналов, генерируемых на этапе перекрытия и суммирования. Этап перекрытия и суммирования настроен на снижение влияния обнаруженных переходных процессов или для исключения обнаруженных переходных процессов при сложении. 3 н. и 14 з.п. ф-лы, 19 ил.