Расширенное использование голосовой почты посредством автоматического создания предварительного просмотра сообщения голосовой почты



Расширенное использование голосовой почты посредством автоматического создания предварительного просмотра сообщения голосовой почты
Расширенное использование голосовой почты посредством автоматического создания предварительного просмотра сообщения голосовой почты
Расширенное использование голосовой почты посредством автоматического создания предварительного просмотра сообщения голосовой почты
Расширенное использование голосовой почты посредством автоматического создания предварительного просмотра сообщения голосовой почты
Расширенное использование голосовой почты посредством автоматического создания предварительного просмотра сообщения голосовой почты
Расширенное использование голосовой почты посредством автоматического создания предварительного просмотра сообщения голосовой почты
Расширенное использование голосовой почты посредством автоматического создания предварительного просмотра сообщения голосовой почты

 


Владельцы патента RU 2520355:

МАЙКРОСОФТ КОРПОРЕЙШН (US)

Изобретение относится к обработке сообщений голосовой почты, в частности к расширенному предварительному просмотру сообщений голосовой почты. Технический результат - расширение функциональных возможностей за счет транскрибирования текстовой версии, двунаправленного переключения между текстовой и аудиоверсиями вместе с воспроизведением-перескоком и создания контекстуальных данных, получаемых из метаданных сообщения голосовой почты и хранилищ данных, связанных с пользователем, таких как списки контактов, история сообщений электронной почты. Система связи для расширенного предварительного просмотра сообщений голосовой почты содержит сервер, конфигурированный для приема сообщений голосовой почты, определения контекстуальной информации, формирования предварительного просмотра сообщений на основе транскрибирования, вставки дополнительной текстовой и графической информации в транскрибирование, воспроизведения предварительного просмотра сообщения и обеспечения представления предварительного просмотра сообщения вызываемой стороне. 3 н. и 16 з.п. ф-лы, 7 ил.

 

ПРЕДПОСЫЛКИ СОЗДАНИЯ ИЗОБРЕТЕНИЯ

Для пользователей становится обыденным иметь доступ к своей голосовой почте в своих входящих сообщениях электронной почты или мгновенных сообщениях. В основном они приходят в виде аудиовложения к сообщению электронной почты (или мгновенному сообщению), в котором в аудиоданных заключено содержимое голосовой почты. Аудиоданные могут быть воспроизведены, когда это потребуется. Обработка голосовой почты часто характеризуется неоднородностью в информации типичного рабочего процесса коммуникаций работника, в котором преобладает технология электронной почты и аналогичные технологии.

Другие подходы создают (либо автоматически, либо с помощью людей) результат транскрибирования сообщения голосовой почты во входящем ящике голосовой почты. Эти услуги, как правило, не интегрированы в нормальный поток данных пользователя. Их главная ценность проистекает из возможности прочтения самого результата транскрибирования, и, следовательно, важно добиться почти идеального транскрибирования.

КРАТКОЕ ОПИСАНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯ

Данное краткое описание сущности изобретения предоставлено в качестве вводной части к выбору, в упрощенной форме, концепций, которые дополнительно описаны ниже в подробном описании. Данное краткое описание сущности изобретения не предназначено устанавливать ключевые признаки или неотъемлемые признаки заявленного предмета и не предназначено использоваться в качестве средства при определении объема заявленного предмета.

Варианты осуществления направлены на предоставление возможности предварительного просмотра сообщения голосовой почты в качестве сочетания текстового и аудиоформатов путем получения преимущества от информации, автоматически извлекаемой из источников данных, связанных с пользователем и метаданными сообщения голосовой почты. В дополнение к возможности двунаправленного переключения между текстовой и аудио версиями сообщения голосовой почты вместе с воспроизведением-перескоком, элементы и взаимодействия с предварительным просмотром сообщения голосовой почты расширяют полезность голосовой почты за рамки простого чтения текста. В соответствии с некоторыми вариантами осуществления информация в сообщении голосовой почты, используя контекстуальные данные, обрабатывается и создается с возможностью выполнения действий.

Эти и прочие признаки и преимущества станут очевидны из прочтения нижеследующего подробного описания и просмотра связанных с ним чертежей. Должно быть понятно, что все из вышеперечисленного, а именно общее описание и нижеследующее подробное описание, являются поясняющими и не ограничивают аспекты, как заявлено.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Фиг.1 является схемой, иллюстрирующей характерную систему унифицированной связи, в которой могут быть реализованы варианты осуществления для расширенного использования голосовой почты посредством автоматического предварительного просмотра сообщения голосовой почты;

Фиг.2 является концептуальной схемой, иллюстрирующей пример системы для обеспечения расширенного предварительного просмотра сообщения голосовой почты;

Фиг.3 иллюстрирует основные компоненты при обеспечении расширенного предварительного просмотра сообщения голосовой почты в соответствии с вариантами осуществления;

Фиг.4 иллюстрирует снимок с экрана характерного интерфейса пользователя для обеспечения расширенного предварительного просмотра сообщения голосовой почты;

Фиг.5 является средой сетевой структуры, в которой может быть реализована система в соответствии с вариантами осуществления;

Фиг.6 является структурной схемой характерной вычислительной операционной среды, в которой могут быть реализованы варианты осуществления; и

Фиг.7 иллюстрирует логическую блок-схему для обеспечения расширенного предварительного просмотра сообщения голосовой почты в соответствии с вариантами осуществления.

ПОДРОБНОЕ ОПИСАНИЕ

Как вкратце описано выше, наряду с аудиоверсией может формироваться текстовый предварительный просмотр сообщения голосовой почты и предоставляться пользователю посредством электронной почты или аналогичного средства. Транскрибирование в текстовую версию, как, впрочем, и создание дополнительных возможностей, таких как обеспечение информации с возможностью выполнения действий, выполняется на основании контекстуальных данных, полученных из хранилищ данных, связанных с пользователем, и метаданных сообщения голосовой почты. В нижеследующем подробном описании делаются ссылки на прилагаемые чертежи, которые являются частью описания и в которых в качестве иллюстрации показаны конкретные варианты осуществления или примеры. Эти аспекты могут объединяться, могут использоваться другие аспекты и могут выполняться структурные изменения, не отступая от сущности и объема настоящего изобретения. Вследствие этого нижеследующее подробное описание не должно рассматриваться с точки зрения ограничения, и объем настоящего изобретения определяется прилагаемой формулой изобретения и ее эквивалентами.

Хотя варианты осуществления описаны ниже в общем контексте программных модулей, которые исполняются в отношении прикладной программы, которая исполняется на операционной системе персонального компьютера, специалист в соответствующей области должен отдавать себе отчет в том, что аспекты также могут быть реализованы в сочетании с прочими программными модулями.

Как правило, программные модули включают в себя стандартные программы, программы, компоненты, структуры данных и структуры других типов, которые выполняют конкретные задачи или реализуют конкретные абстрактные типы данных. Более того, специалист в соответствующей области должен принимать во внимание, что варианты осуществления могут быть выполнены на практике при помощи других конфигураций компьютерной системы, включая переносные устройства, многопроцессорные системы, программируемую или на базе микропроцессора потребительскую электронику, мини-компьютеры, компьютеры класса мэйнфрейм и сопоставимые вычислительные устройства. Варианты осуществления также могут быть выполнены на практике в распределенных вычислительных средах, в которых задачи выполняются удаленными устройствами обработки, которые связаны друг с другом посредством сети связи. В распределенной вычислительной среде программные модули могут размещаться как на локальных, так и на удаленных устройствах хранения в памяти.

Варианты осуществления могут быть реализованы в качестве реализуемого компьютером процесса (способа), вычислительной системы или изделия, такого как компьютерный программный продукт или машиночитаемый носитель информации. Компьютерный программный продукт может быть компьютерным носителем данных, считываемым компьютерной системой и имеющим закодированную компьютерную программу, которая содержит инструкции, предписывающие компьютеру или вычислительной системе выполнять характерный процесс(ы). Машиночитаемый носитель данных может быть, например, реализован посредством одного или более из временной компьютерной памяти, постоянной памяти, накопителя на жестком диске, накопителя с флэш-памятью, гибкого диска или компакт-диска и сравнимых средств. Компьютерный программный продукт также может быть сигналом, передаваемым на несущей (например, частотно- или фазомодулированным сигналом), или носителем информации, считываемым вычислительной системой, с закодированной на нем компьютерной программой из инструкций для выполнения компьютерного процесса.

В настоящем описании понятие «платформа» может означать сочетание компонентов программного и аппаратного обеспечения для управления приложениями связи, используемыми для доставки предварительного просмотра сообщения голосовой почты. Примеры платформ включают в себя, но не ограничиваются размещенной услугой, предоставляемой с помощью множества серверов; приложением, исполняемым на одном сервере, и сопоставимыми системами. Понятие «сервер», как правило, относится к вычислительному устройству, выполняющему одну или более программ, как правило, в сетевой среде. Сервер также может быть реализован как виртуальный сервер (программа), выполняемый на одном или более вычислительных устройствах, видимых в сети в качестве сервера. Более подробно эти технологии и характерные операции предоставлены ниже.

Более того, используемое здесь понятие «предварительный просмотр сообщения голосовой почты» относится к текстовым данным, извлекаемым из сообщения голосовой почты, размеченным элементами с возможностью выполнения действия и встроенным в рабочую услугу, такую как приложение электронной почты, приложение обмена мгновенными сообщениями и аналогичные приложения связи. Текстовые данные могут включать в себя результаты машинного транскрибирования (например, автоматического распознавания голоса), результаты транскрибирования с участием человека и сопоставимые виды, которые могут отразить сообщение голосовой почты целиком или в кратком виде. В соответствии с некоторыми вариантами осуществления данные, полученные из сообщения голосовой почты, также могут включать в себя графические свойства.

На Фиг.1 проиллюстрирована схема 100 характерной схемы унифицированной связи, в которой могут быть реализованы варианты осуществления для расширенного использования голосовой почты посредством автоматического предварительного просмотра сообщения голосовой почты. Система унифицированной связи является примером модемной системы связи с широким диапазоном возможностей и услуг, которые могут предоставляться абонентам, таких как расширенный предварительный просмотр сообщения голосовой почты. Система унифицированной связи является системой связи в реальном времени, способствующей обмену мгновенными сообщениями, получению сведений о присутствии, осуществлению аудио- и видеоконференций, обеспечению функциональных возможностей осуществления web-конференций и сопоставимым возможностям.

В системе унифицированной связи («UC»), такой как показанная на схеме 100, пользователи могут осуществлять связь при помощи многообразия оконечных устройств (102, 104), которые являются клиентскими устройствами системы UC. Каждое клиентское устройство может иметь возможность выполнения одного или более приложений связи для голосовой связи, видеосвязи, обмена мгновенными сообщениями, совместного использования приложения, совместного использования данных и подобного. В дополнение к их расширенным функциональным возможностям конечные устройства также могут способствовать осуществлению обычных телефонных вызовов посредством внешних соединений, как через PBX 124 к Телефонной Коммутируемой Сети Общего Пользования («PSTN»). Оконечные устройства могут включать в себя любой тип из интеллектуального телефона, сотового телефона, любого вычислительного устройства, выполняющего приложение связи, интеллектуальной автомобильной консоли и усовершенствованного телефонного устройства с дополнительными функциональными возможностями.

Сеть 110 UC включает в себя некоторое число серверов, выполняющих разные задачи. Например, серверы 114 UC обеспечивают функциональные возможности регистрации, проверки присутствия и маршрутизации. Функциональные возможности маршрутизации позволяют системе маршрутизировать вызовы пользователю до любого из клиентских устройств, назначенных пользователю на основании политик по умолчанию и/или установленных пользователем. Например, если пользователь недоступен через обычный телефон, вызов может быть переадресован на сотовый телефон пользователя, и если номер не отвечает, то могут использоваться опции голосовой почты. Так как конечные устройства могут обрабатывать дополнительные режимы связи, серверы 114 UC могут обеспечивать доступ к этим дополнительным режимам связи (например, обмену мгновенными сообщениями, видеосвязи и т.д.) через сервер 112 доступа. Сервер 112 доступа размещается во внешней сети и позволяет осуществлять связь с помощью сетей 110 UC с другими пользователями в одном из дополнительных режимов связи. Серверы 114 UC могут включать в себя серверы, которые обеспечивают сочетания вышеописанных функциональных возможностей, или специализированные серверы, которые обеспечивают только конкретные функциональные возможности. Например, домашние серверы, обеспечивающие функциональные возможности проверки присутствия, серверы маршрутизации, обеспечивающие функциональные возможности маршрутизации, серверы управления правами и т.д. Аналогичным образом, сервер 112 доступа может обеспечивать множество функциональных возможностей, таких как защита с помощью межсетевого экрана и способность к подключению, или только конкретные функциональные возможности.

Сервер 118 осуществления аудио/видео конференций (A/V) обеспечивает возможности осуществления аудио и/или видеоконференций посредством поддержки их через внутреннюю или внешнюю сеть. Сервер 116 посредничества осуществляет посредническую передачу сигнализации и медиаданных к и от сетей других типов, таких как PSTN или сотовая сеть (например, вызовов через PBX 124 или с сотового телефона 122). Сервер 115 голосовой почты может управлять сообщениями голосовой почты для абонентов системы UC, выполняя задачи, такие как хранение и доставка сообщений голосовой почты, транскрибирование аудиофайлов в текстовые данные и формирование сообщений электронной почты или мгновенных сообщений с расширенным предварительным просмотром сообщения голосовой почты в соответствии с некоторыми вариантами осуществления. Сервер 116 посредничества также может выступать в роли агента пользователя с Протоколом Инициации Сеанса (SIP).

В системе UC пользователи могут иметь одни или более идентификационные данные, которые не обязательно ограничиваются телефонным номером. Идентификационные данные могут принимать любой вид в зависимости от встроенных сетей, такой как телефонный номер, Унифицированный Идентификатор Ресурса (URI) Протокола Инициации Сеанса (SIP) или любой другой идентификатор. Хотя в системе UC может использоваться любой протокол, предпочтительным способом является SIP.

SIP является протоколом управления (сигнализации) уровня приложения для создания, изменения и прекращения сеанса с одним или более участниками. Он может использоваться для создания двухсторонних, многопользовательских или многоадресных сеансов, которые включают в себя вызовы через Интернет телефон, мультимедийную рассылку и мультимедийные конференции. SIP разработан, чтобы быть независимым от базового транспортного уровня.

Клиенты SIP могут использовать Протокол Управления Транспортировкой («TCP») для соединения с серверами SIP и прочими оконечными узлами SIP. SIP главным образом используется при установке и прерывании голосовой передачи или голосовых вызовов. Однако он может использоваться в любом приложении, в котором требуется инициация сеанса. Это включает в себя подписку и уведомление о событии, мобильности терминала и т.д. Голосовая и/или видеосвязь, как правило, осуществляется по отдельным протоколам сеанса и, как правило, Протоколу Реального Времени («RTP»).

Хотя характерная система на Фиг.1 описана с конкретными компонентами, такими как сервер посредничества, сервер A/V и аналогичные устройства, варианты осуществления не ограничены данной системой характерных компонентов и конфигураций. Услуга для расширенного предварительного просмотра сообщения голосовой почты может быть реализована в других системах и конфигурациях, использующих меньшее или большее число компонентов. Более того, такие системы не обязательно должны быть системами расширенной связи, объединяющими различные режимы связи. Варианты осуществления также могут быть реализованы применительно к сообщениям голосовой почты, доставляемым в обычных системах связи, таких как PSTN или сотовые сети, используя описываемые здесь принципы.

Фиг.2 является концептуальной схемой 200, иллюстрирующей основную характерную систему для обеспечения расширенного предварительного просмотра сообщения голосовой почты. Хотя система в соответствии с вариантами осуществления, вероятно, включает в себя некоторое число серверов, клиентских устройств и услуг, как показано на Фиг.1, на Фиг.2 представлены только те, что относятся к вариантам осуществления.

Как рассматривалось ранее, существует много ситуаций, при которых прослушивание сообщения голосовой почты, даже в виде прикрепленной записи, невозможно или неудобно. В большинстве случаев текстовый вид сообщения голосовой почты предпочтительнее, но доступные решения имеют упомянутые ранее недостатки, обязательно присутствующие в результатах транскрибирования. Варианты осуществления обеспечивают технологии, поддерживающие более полную и более богатую интеграцию голосовой почты в информационный рабочий процесс пользователя. Данная интеграция в наиболее распространенную обработку информации пользователя (электронную почту, обмен мгновенными сообщениями и аналогичные виды) поддерживается посредством контекста, доступного в хранилище данных пользователя, и обеспечивает дополнительные возможности, кроме простого чтения сообщения, а именно такие как аудионавигация, формирование контакта, поиск по сообщению голосовой почты, поведение, связанное с мгновенным сообщением, и т.п.

В соответствии с некоторыми вариантами осуществления текстовый предварительный просмотр сообщения голосовой почты формируется посредством автоматического распознавания речи и доставляется получателю посредством электронной почты, мгновенного сообщения или аналогичной технологии обмена сообщениями. Модуль распознавания речи непосредственно интегрирован в системы голосовой почты и обмена сообщениями в соответствии с одним вариантом осуществления. Благодаря данной глубокой интеграции модуль распознавания речи способен использовать существенную контекстуальную информацию о вызывающем и вызываемом абонентах для повышения точности (достоверности) распознавания. Это включает в себя, но не ограничивается, имена сторон, их соответствующие списки контактов, их организационные структуры, ранее выполненные связи между сторонами, связи, относящиеся к сторонам, и т.д. Однако, как отмечено выше, варианты осуществления не ограничиваются данными, формируемыми автоматическим распознаванием речи. Также могут быть предоставлены элементы с возможностью выполнения действий и контекстуальная информация, используя данные, транскрибированные с участием человека, сочетание данных, транскрибированных с участием человека и сформированных машиной, и сопоставимую информацию, размечаемую в схеме, которая интерпретируется клиентскими приложениями.

Таким образом, сервер 234 голосовой почты в характерной системе принимает сообщение голосовой почты в аудиоформе и дополнительно принимает контекстуальную информацию от источников, подобных серверу 236 сведений о присутствии, серверу 238 электронной почты и т.д. Например, сведения о присутствии могут включать в себя местоположение, связанное с вызывающим абонентом, и слова в сообщении голосовой почты могут распознаваться с большей точностью на основании сведений о том, откуда вызывающий абонент. Сервер 234 голосовой почты может обрабатывать текст от модуля распознавания речи или другого источника результатов транскрибирования таким образом, что может идентифицироваться ключевая информация (например, имена или ключевые позиции), особым образом интерпретироваться и создаваться с возможностью выполнения действий как соответствующая преимуществам пользователя. Подсистема интерпретации может использовать дополнительную контекстуальную информацию наряду с понятийным выделением, предоставляемым подсистемой речи для обеспечения визуального представления пользователю сообщения голосовой почты. Интерпретированный предварительный просмотр 240 сообщения голосовой почты может предоставляться пользовательскому (244) приложению обмена сообщениями, выполняемому вычислительным устройством 242, для представления интерфейсом пользователя приложения обмена сообщениями. В соответствии с другими вариантами осуществления клиентские приложения (вместо сервера голосовой почты) могут вставлять различные источники информации, такие как присутствие, в сообщение предварительного просмотра сообщения голосовой почты.

Характерным вариантом реализации приложения обмена сообщениями для доставки расширенного предварительного просмотра сообщения голосовой почты является приложение электронной почты. Сообщение электронной почты может доставлять интерпретированный предварительный просмотр сообщения голосовой почты наряду с аудиофайлом сообщения голосовой почты так, что доступно переключение между текстовыми данными и аудиофайлом наряду с возможностями поиска, позволяющими получателю легко осуществлять поиск частей аудиофайла в дополнение к возможностям по запросу/выполнению действий, основанных на информации в сообщении голосовой почты. Хотя электронная почта и обмен мгновенными сообщениями часто именуются как характерные услуги, в которые может быть интегрирован предварительный просмотр сообщения голосовой почты, варианты осуществления не ограничиваются этим. При обеспечении пользователю восприятия расширенного предварительного просмотра сообщения голосовой почты также могут использоваться прочие системы обмена сообщениями, такие как SMS, подписки RSS и другие сопоставимые.

Фиг.3 иллюстрирует основные компоненты при обеспечении расширенного предварительного просмотра сообщения голосовой почты в соответствии с вариантами осуществления на схеме 300. Как рассматривалось выше, контекстуальная информация, такая как сведения 352 о присутствии, информация 354 контактной/адресной книги (связанной с вызывающим и/или вызываемым абонентом), информация 356 истории сообщений электронной почты и аналогичные данные используются на различных этапах формирования расширенного предварительного просмотра сообщения голосовой почты.

Например, аудиоверсия сообщения 358 голосовой почты может транскрибироваться в вид 360 форматированного текста (с элементами выполнения действий, выделениями и прочими свойствами), используя контекстуальную информацию для улучшения точности транскрибирования и для добавления свойств. Вид 360 форматированного текста сообщения голосовой почты затем может дополнительно обрабатываться (362) при помощи дополнительных свойств, вновь используя контекстуальную информацию. Информация, используемая на разных этапах, может различаться. Например, на одном этапе может использоваться информация, связанная с вызывающим абонентом, в то время как на другом этапе может использоваться информация, связанная с вызываемым абонентом.

Конечный продукт обработки 362, расширенный предварительный просмотр сообщения голосовой почты может интегрироваться в сообщение электронной почты наряду с аудиоверсией сообщения (358) голосовой почты и представляться абоненту посредством интерфейса 364 пользователя приложения электронной почты. Аудиоверсия сообщения голосовой почты может прикрепляться к сообщению электронной почты или может предоставляться ссылка на ее местоположение.

Посредством этих основных компонентов и их взаимодействий сообщение голосовой почты интегрируется в рабочий процесс электронной почты наряду со сведениями о присутствии. Ключевые части сообщения голосовой почты выполняются с возможностью выполнения действия, и обеспечивается расширенная навигация по аудиоданным сообщения голосовой почты, позволяя абоненту перескакивать в любое место в аудиофайле сообщения голосовой почты посредством щелчка на соответствующий текст (т.е. перескок воспроизведения или изменение позиции в аудиоданных). Таким образом, текстовое представление сообщения голосовой почты представляется так, что абонент может легче найти ключевую информацию, не отвлекаясь на обычно присутствующие ошибки распознавания речи.

Рассмотренные выше сценарии, характерные системы, приложения и конфигурации представлены в целях иллюстрации. Варианты осуществления не ограничиваются этими примерами. Другие виды транскрибирования, конфигурации, режимы связи и сценарии могут использоваться при реализации расширенного предварительного просмотра сообщения голосовой почты, аналогичным образом используя описанные здесь принципы.

Фиг.4 иллюстрирует снимок с экрана характерного интерфейса пользователя для обеспечения расширенного предварительного просмотра сообщения голосовой почты. Элементы и конфигурации интерфейса пользователя на снимке с экрана представлены только в целях иллюстрации и не накладывают ограничения на варианты осуществления. Приложение обмена сообщениями, способное представлять расширенные предварительные просмотры сообщений голосовой почты пользователям, может использовать любой интерфейс пользователя с другими элементами и конфигурациями. Характерный интерфейс пользователя включает в себя стандартные графические и текстовые элементы 472, такие как команды, опции и прочие элементы.

Интерпретация сообщения голосовой почты предоставляет информацию интерфейсу пользователя приложения электронной почты, которая помогает в навигации и воспроизведении аудиоданных сообщения голосовой почты. Например, щелкая по слову в текстовой интерпретации 476 сообщения голосовой почты, можно начать воспроизведение сообщения голосовой почты с места, в котором произносится это слово. Выделение группы слов может запустить воспроизведение всего лишь сегмента аудиоданных сообщения голосовой почты. В дополнение к связи текст-аудио также может предоставляться элемент 474 стандартного воспроизведения аудиоинтерфейса пользователя.

Части интерпретации сообщения голосовой почты выполнены с возможностью выполнения действия в интерфейсе пользователя приложения электронной почты посредством интеграции со сведениями о присутствии, доступными системе электронной почты. Например, щелчок правой кнопки мыши на имени выводит список действий, которые пользователю может быть желательно выполнить в отношении имени, а именно: добавление имени в список контактов пользователя, обращение к названному человеку через мгновенное сообщение, установка голосового вызова с названным человеком и аналогичные действия. Действия могут представляться во всплывающем меню 480 или аналогичных элементах интерфейса пользователя (висящем элементе отображения, выпадающем меню и подобном).

Интерпретированное текстовое сообщение 476 голосовой почты может включать в себя графические или основанные на цветовых схемах элементы для обеспечения дополнительной информации по синтаксису и словам с возможностью выполнения действия. Более того, информация, доступная в интерпретированном сообщении голосовой почты, может быть добавлена в поисковый индекс сервера электронной почты. Таким образом, сообщения голосовой почты делаются с возможностью поиска как по тексту, который интерпретирован, так и, потенциально, по метаданным, лежащим в основе текста. Поиск данных предварительного просмотра также возможен посредством поисковых систем рабочего настольного компьютера, систем мобильного устройства и так далее, а не только серверов. Сообщение электронной почты, несущее в себе предварительный просмотр сообщения голосовой почты, может включать в себя имена вызывающего и вызываемого абонентов, как, впрочем, и подробные сведения о присутствии вызывающего абонента, чтобы позволить вызываемому абоненту предпринять правильные действия на основании информации в сообщении электронной почты.

Интерфейс пользователя применительно к приложению обмена сообщениями, способному представлять предварительный просмотр сообщения голосовой почты, может включать в себя больше или меньше текстовых и графических элементов и может использовать другие графические, цветовые и прочие схемы конфигурации для отображения других функциональных возможностей и связанных с ними процессов.

Фиг.5 является характерной средой сетевой структуры, в которой могут быть реализованы варианты осуществления. Платформа, обеспечивающая услуги связи с расширенным предварительным просмотром сообщения голосовой почты, может быть реализована через программное обеспечение, выполняемое на одном или более серверах 518, такое как размещаемую услугу. Платформа может осуществлять связь с клиентскими приложениями на индивидуальных вычислительных устройствах, таких как сотовый телефон 513, компьютер 512 класса лэптоп и настольный компьютер 511 (клиентские устройства), посредством сети(ей) 510.

Как рассматривалось выше, голосовая почта может доставляться от некоторого количества источников, включая обычные телефонные системы, расширенные системы связи и т.д., внутри сети(ей) 510, или посредством внешней сети(ей) 520 к приложению/серверу управления голосовой почтой. Приложение/сервер управления голосовой почтой может принимать дополнительную информацию, включающую в себя, без ограничения, сведения о присутствии, контактную информацию и метаданные сообщения голосовой почты. Данная контекстуальная информация может использоваться при транскрибировании сообщения голосовой почты в текстовые данные и формировании расширенных возможностей, таких как данные с возможностью выполнения действий, чтобы быть представленными в текстовом виде абоненту, принимающему сообщение голосовой почты.

Клиентские устройства 511-513 используются, чтобы способствовать осуществлению связи посредством различных режимов между абонентами системы связи. Информация, связанная с абонентами и способствующая расширенному предварительному просмотру сообщения голосовой почты, может храниться в одном или более хранилищах данных (например, хранилище 516 данных), которое может управляться любым из серверов 518 или сервером 514 базы данных.

Сеть(и) 510 может(гут) быть выполнена(ы) по любой топологии из серверов, клиентов, поставщиков Интернет-услуг и средств связи. Система в соответствии с вариантами осуществления может иметь статическую или динамическую топологию. Сеть(и) 510 может(гут) включать в себя защищенную сеть, такую как корпоративная сеть, и незащищенную сеть, такую как беспроводная открытая сеть или Интернет. Сеть(и) 510 также может(гут) координировать связь по прочим сетям, таким как PSTN или сотовым сетям (например, внешней сети(ям) 520). Сеть(и) 510 обеспечивает(ют) связь между описанными здесь узлами. В качестве примера, а не ограничения, сеть(и) 510 может(гут) включать в себя беспроводные средства, такие как акустические, RF, инфракрасные и прочие беспроводные средства.

Для реализации системы предварительного просмотра сообщения голосовой почты с расширенными возможностями могут использоваться многие другие конфигурации вычислительных устройств, приложений, источников данных и систем распределения данных. Более того, среды сетевых структур, рассмотренные на Фиг.5, представлены исключительно в целях иллюстрации. Варианты осуществления не ограничиваются характерными приложениями, модулями и процессами.

Фиг.6 и связанное с ней рассмотрение предназначены для представления краткого общего описания приемлемой вычислительной среды, в которой могут быть реализованы варианты осуществления. На Фиг.6 проиллюстрирована структурная схема характерной вычислительной операционной среды для приложения в соответствии с вариантами осуществления, такой как вычислительное устройство 600. В базовой конфигурации вычислительное устройство 600 может быть сервером управления голосовой почты как части системы связи и включает в себя, по меньшей мере, один модуль 602 обработки и системную память 604. Вычислительное устройство 600 также может включать в себя множество модулей обработки, которые кооперируют при выполнении программ. В зависимости от точной конфигурации и типа вычислительного устройства системная память 604 может быть временной (такой как RAM), постоянной (такой как ROM, флэш-память и т.д.) или некоторым сочетанием обоих. Системная память 604, как правило, включает в себя операционную систему, приемлемую для управления функционированием платформы, такую как операционные системы WINDOWS® от MICROSOFT CORPORATION, Редмонд, Вашингтон. Системная память 604 также может включать в себя одно или более приложений программного обеспечения, таких как программные модули 606, приложение 622 работы с голосовой почтой и модуль 624 транскрибирования.

Приложение 622 работы с голосовой почтой может быть частью услуги, которая способствует связи посредством различных модальностей между клиентскими приложениями, серверами и прочими устройствами (например, голосовым, электронной почты, обмена мгновенными сообщениями и т.д.). Модуль 624 транскрибирования может транскрибировать аудиофайлы сообщений голосовой почты в текстовые данные, используя контекстуальную информацию, как рассматривалось ранее. Модуль 624 транскрибирования и приложение 622 работы с голосовой почтой могут быть отдельными приложениями или неотъемлемыми модулями размещаемой услуги, которая обеспечивает расширенные услуги связи клиентским приложениям/устройствам, такие как предварительный просмотр сообщения голосовой почты с информацией с возможностью выполнения действий посредством сообщения электронной почты или мгновенного сообщения. Эта базовая конфигурация проиллюстрирована на Фиг.6 теми компонентами, которые находятся внутри пунктирной линии 608.

Вычислительное устройство 600 может иметь дополнительные свойства или функциональные возможности. Например, вычислительное устройство 600 также может включать в себя дополнительные устройства хранения данных (съемное и/или несъемное), такие как, например, магнитные диски, оптические диски или лента. Такие дополнительные устройства хранения проиллюстрированы на Фиг.6 как съемное устройство 609 хранения и несъемное устройство 610 хранения. Машиночитаемый носитель данных может включать в себя временный и постоянный, съемный и несъемный носитель данных, реализованный любым способом или по любой технологии хранения информации, такой как машиночитаемые инструкции, структуры данных, программные модули или прочие данные. Системная память 604, съемное устройство 609 хранения и несъемное 610 устройство хранения, все эти компоненты являются примерами машиночитаемого носителя данных. Машиночитаемый носитель данных включает в себя, но не ограничивается, RAM, ROM, EEPROM, флэш-память или другую технологию памяти, CD-ROM, универсальные цифровые диски (DVD) или прочие оптические устройства хранения, магнитные кассеты, магнитную ленту, устройство хранения на магнитных дисках или прочие устройства магнитного хранения, или любые другие носители данных, которые могут использоваться для хранения требуемой информации и доступ к которым может быть получен посредством вычислительного устройства 600. Любой такой машиночитаемый носитель данных может быть частью вычислительного устройства 600. Вычислительное устройство 600 также может иметь устройство(а) 612 ввода, такое как клавиатура, мышь, перо, устройство голосового ввода, устройство сенсорного ввода и сопоставимые устройства ввода. Также может быть включено устройство(а) 614 вывода, такое как дисплей, громкоговоритель, принтер и устройства вывода других типов. Эти устройства хорошо известны в соответствующей области техники и не требуют здесь детального рассмотрения.

Вычислительное устройство 600 также может содержать соединения 616 связи, которые позволяют устройству осуществлять связь с другими устройствами 618, как, например, по беспроводной сети в распределенной вычислительной среде, спутниковой линии связи, сотовой линии связи и сопоставимым механизмам. Прочие устройства 618 могут включать в себя компьютерное устройство(а), которое выполняет приложение осуществления связи, серверы электронной почты или присутствия и сопоставимые устройства. Соединение(ия) 616 связи является одним примером средства связи. Здесь средства связи могут включать в себя машиночитаемые инструкции, структуры данных, программные модули или прочие данные в модулированном сигнале данных, таком как несущая волна или другой механизм транспортировки, и включает в себя любое средство доставки информации. Понятие «модулированный сигнал данных» означает сигнал, который обладает одной или более своими характеристиками, устанавливаемыми или изменяемыми таким образом, чтобы кодировать информацию в сигнале. В качестве примера, а не ограничения, средства связи включают в себя проводные средства, такие как проводную сеть или непосредственное проводное соединение, и беспроводные средства, такие как акустические, RF, инфракрасные и прочие беспроводные средства.

Характерные варианты осуществления также включают в себя способы. Эти способы могут реализовываться любыми путями, включая структуры, описанные в данном документе, например, посредством машинных операций устройств того типа, как описано в данном документе.

Другим опциональным путем является выполнение одной или более индивидуальных операций способа одним или более людьми-операторами, выполняющими их часть. Не требуется, чтобы эти операторы располагались вместе, и каждый может находится только с той машиной, которая выполняет часть программы.

Фиг.7 иллюстрирует логическую блок-схему процесса 700 обеспечения расширенного предварительного просмотра сообщения голосовой почты в соответствии с вариантами осуществления. Процесс 700 может быть реализован как часть расширенной системы связи в сервере голосовой почты.

Процесс 700 начинается с операции 710, в которой принимается сообщение голосовой почты для абонента, связанного с сервером голосовой почты. Сообщение голосовой почты может храниться в качестве аудио файла. В операции 720 сервером голосовой почты может приниматься контекстуальная информация, такая как сведения о присутствии или контактная информация, связанная с абонентом (и их контакты), информация об истории сообщений электронной почты и метаданные голосовой почты (источник сообщения голосовой почты и любая дополнительная информация, которая может быть включена вместе с сообщением голосовой почты в расширенной системе связи).

В операции 730 аудиоданные голосовой почты транскрибируется в текстовые данные, используя контекстуальную информацию. Контекстуальная информация используется не только для повышения соответствия транскрибирования, но также может использоваться для обнаружения информации в текстовом формате внутри сообщения голосовой почты. Как рассматривалось ранее, варианты осуществления не ограничиваются основанными на автоматическом распознавании голоса результатах транскрибирования или текстовых данных. Могут использоваться другие виды преобразования из сообщения голосовой почты в текстовые и/или графические данные для обеспечения расширенного предварительного просмотра сообщения голосовой почты. В операции 740 транскрибированное сообщение голосовой почты дополнительно обрабатывается исходя из контекстуальной информации, например: некоторая информация интерпретируется с возможностью выполнения действий; для улучшения представления добавляются цветовые/графические схемы; добавляются возможности обратного переключения и поиска в аудиофайле и аналогичные действия. Данный расширенный предварительный просмотр сообщения голосовой почты может быть вставлен в сообщение электронной почты, мгновенное сообщение или аналогичное основанное на тексте сообщение связи. Сообщение также может включать в себя копию аудиоверсии сообщения голосовой почты или ссылку на местоположение аудиофайла. В операции 750 сообщение, включающее в себя расширенный предварительный просмотр сообщения голосовой почты, может переадресовываться абоненту.

Некоторые или все из элементов с возможностью выполнения действий могут быть представлены абоненту по завершении процесса авторизации. Действия, предоставляемые вызываемому абоненту на основании ключевой части предварительного просмотра сообщения голосовой почты, включают в себя действия, которые будут выполняться приложением электронной почты, отображающим предварительный просмотр сообщения голосовой почты, или действия, которые будут выполняться другими приложениями. Более того, элементы интерфейса пользователя приложения электронной почты, отображающие предварительный просмотр сообщения голосовой почты, могут динамически изменяться, исходя из элементов с возможностью выполнения действий в предварительном просмотре сообщения голосовой почты.

Операции, включенные в процесс 700, представлены в целях иллюстрации. Расширенный предварительный просмотр сообщения голосовой почты через приложение электронной почты или приложение обмена мгновенными сообщениями может реализовываться аналогичными процессами с меньшим или большим количеством этапов, как, впрочем, и в порядке, отличном от операций, использующих описанные здесь принципы.

Представленное выше техническое описание, примеры и данные предоставляют полное описание по обработке и использованию сочетания вариантов осуществления. Хотя предмет изобретения был описан посредством структурных признаков и/или методологических действий, должно быть понятно, что предмет изобретения, определенный в прилагаемой формуле изобретения, необязательно ограничивается конкретными описанными здесь признаками или действиями. Наоборот, конкретные описанные выше признаки и действия раскрыты в качестве характерных форм реализации формулы изобретения и вариантов осуществления.

1. Способ, выполняемый по меньшей мере частично на вычислительном устройстве для обеспечения расширенного предварительного просмотра сообщения голосовой почты, при этом способ содержит
прием аудиоданных сообщения голосовой почты для пользователя;
определение контекстуальной информации, ассоциированной с пользователем и вызывающей стороной;
определение ключевой контактной информации и информации о присутствии, ассоциированной с доступностью вызывающей стороны, из контекстуальной информации;
формирование предварительного просмотра сообщения голосовой почты, основанного на транскрибировании аудиоданных сообщения голосовой почты, с использованием по меньшей мере части контекстуальной информации, так что точность соответствия текста аудиоданным повышается, и в предварительном просмотре сообщения голосовой почты предоставляется множество элементов с возможностью выполнения действий;
вставку предварительного просмотра сообщения голосовой почты в сообщение, основанное на тексте, для доставки пользователю наряду с доступом к аудиоданным сообщения голосовой почты; и
представление ключевой контактной информации и информации о присутствии, ассоциированной с доступностью и местоположением вызывающей стороны, и информации прежних связей с вызывающей стороной вместе с предварительным просмотром сообщения голосовой почты.

2. Способ по п.1, в котором контекстуальная информация включает в себя по меньшей мере одно из группы, включающей в себя метаданные сообщения голосовой почты, информацию о присутствии, контактную информацию, организационную информацию и существенную информацию связи.

3. Способ по п. 1, в котором сообщение, основанное на тексте, включает в себя по меньшей мере одно из сообщений электронной почты, обмена мгновенным сообщениями, SMS сообщения, сообщения RSS подписки.

4. Способ по п.1, дополнительно содержащий идентификацию ключевой информации в предварительном просмотре сообщения голосовой почты на основе контекстуальной информации;
воспроизведение идентифицированной ключевой информации в качестве информации с возможностью выполнения действий; и
представление ключевой информации с возможностью выполнения действий особым образом.

5. Способ по п. 4, в котором ключевая информация включает в себя по меньшей мере одно из группы, включающей в себя имя, место, телефонный номер, адрес, дату, время, адрес электронной почты и web-адрес.

6. Способ по п. 4, в котором воспроизведение ключевой информации с возможностью выполнения действий включает в себя обеспечение списка действий для выбора пользователем в ответ на прием указания заинтересованности пользователя в элементе ключевой информации.

7. Способ по п.1, в котором доступ к аудиоданным сообщения голосовой почты включает в себя одно из предоставления аудиоданных сообщения голосовой почты в прикрепленном файле и предоставления ссылки на местоположение, в котором хранятся аудиоданные сообщения голосовой почты.

8. Способ по п.1, в котором по меньшей мере часть элементов с возможностью выполнения действий представляются пользователю по завершению процесса авторизации, и при этом во время процесса формирования предварительного просмотра сообщения голосовой почты формируется новая контекстуальная информация.

9. Способ по п.1, в котором аудиоданные сообщения голосовой почты воспроизводятся с возможностью поиска посредством предварительного просмотра сообщения голосовой почты и посредством метаданных, лежащих в основе предварительного просмотра сообщения голосовой почты.

10. Система связи для реализации расширенного предварительного просмотра сообщения голосовой почты, при этом система содержит сервер голосовой почты, конфигурированный для
приема сообщения голосовой почты в аудиоформате для вызываемой стороны;
определения контекстуальной информации, содержащей метаданные сообщения голосовой почты, информацию о присутствии, ассоциированную с доступностью вызывающей стороны, контактную информацию, информацию о местоположении и информацию о прежних связях;
формирования предварительного просмотра сообщения голосовой почты на основе транскрибирования сообщения голосовой почты, при этом контекстуальная информация используется для повышения точности соответствия текста аудиоданным;
определения элементов с возможностью выполнения действий в транскрибировании на основе сообщения голосовой почты с использованием контекстуальной информации;
вставки дополнительной текстовой и графической информации в транскрибирование на основе контекстуальной информации, что формирует предварительный просмотр сообщения голосовой почты, причем аудиоданные сообщения голосовой почты приемлемы для поиска посредством выбора соответствующих текстовых элементов в транскрибировании;
воспроизведения предварительного просмотра сообщения голосовой почты, вставляемого в сообщение электронной почты, включая элементы с возможностью выполнения действий, ключевую контактную информацию и информацию о присутствии, ассоциированную с доступностью вызывающей стороны, определенную как часть контекстуальной информации, и дополнительную текстовую и графическую информацию для доставки клиентскому приложению; и
обеспечения представления предварительного просмотра сообщения голосовой почты вызываемой стороне посредством пользовательского интерфейса клиентского приложения электронной почты, причем предварительный просмотр сообщения голосовой почты включает в себя доступ к сообщению голосовой почты.

11. Система по п.10, в которой предварительный просмотр сообщения голосовой почты позволяет вызываемой стороне воспроизводить сообщение голосовой почты в аудио формате, начиная с выбранной точки, путем указания текстового элемента,
соответствующего выбранной точке.

12. Система по п.10, в которой предварительный просмотр сообщения голосовой почты позволяет вызываемой стороне воспроизводить часть сообщения голосовой почты в аудиоформате посредством выделения части сообщения голосовой почты в текстовом формате.

13. Система по п.12, в которой предварительный просмотр сообщения голосовой почты позволяет вызываемой стороне использовать воспроизведение сообщения голосовой почты в аудиоформате и чтение сообщения голосовой почты в текстовом формате независимо, щелкая на элементе пользовательского интерфейса.

14. Система по п.10, в которой предварительный просмотр сообщения голосовой почты дополнительно включает в себя элемент интерфейса для воспроизведения аудио.

15. Система по п.10, в которой используется по меньшей мере одна из графической схемы и цветовой схемы, чтобы обеспечить дополнительную информацию о синтаксисе и элементах с возможностью выполнения действий в транскрибировании сообщения голосовой почты.

16. Способ, выполняемый по меньшей мере частично на вычислительном устройстве для обеспечения расширенного предварительного просмотра сообщения голосовой почты, при этом способ содержит
прием аудиоданных сообщения голосовой почты для вызываемой стороны;
преобразование аудиоданных сообщения голосовой почты в текстовое представление, использующее информацию о присутствии, ассоциированную с доступностью вызывающей стороны, и метаданные сообщения голосовой почты, ассоциированные с вызываемой стороной и вызывающей стороной;
вставку текстового представления в рабочий процесс электронной почты для вызываемой стороны в качестве предварительного просмотра сообщения голосовой почты, при этом ключевые части предварительного просмотра сообщения голосовой почты воспроизводятся с возможностью выполнения действий при выборе пользователем, и причем аудиоданные сообщения голосовой почты приемлемы для поиска посредством выбора соответствующих текстовых элементов в текстовом представлении; и
представление предварительного просмотра сообщения голосовой почты и информации о присутствии, ассоциированной с доступностью и местоположением вызывающей стороны, и информации прежних связей с вызывающей стороной вызываемой стороне посредством пользовательского интерфейса электронной почты.

17. Способ по п.16, в котором действия, предоставляемые вызываемой стороне на основе ключевых частей предварительного просмотра сообщения голосовой почты, включают в себя действия, выполняемые приложением электронной почты, отображающим предварительный просмотр сообщения голосовой почты, и действия, выполняемые другими приложениями.

18. Способ по п.16, в котором элементы пользовательского интерфейса электронной почты, отображающего предварительный просмотр сообщения голосовой почты, динамически изменяются на основании элементов с возможностью выполнения действий в предварительном просмотре сообщения голосовой почты.

19. Способ по п.16, в котором метаданные сообщения голосовой почты используются для получения информации о присутствии, ассоциированной с вызывающей стороной, и для представления информации о присутствии в предварительном просмотре сообщения голосовой почты.



 

Похожие патенты:

Изобретение относится к области вспомогательного оборудования для мобильных телефонов, такого, как носимые абонентом наушники. Техническим результатом является повышение надежности фиксации устройства на теле пользователя, исключение провисания, запутывания и цепляния проводов за окружающие предметы, а также ограничения свободы движений пользователя за счет устойчивого расположения дополнительного узла соединения проводов на голове пользователя.

Изобретение относится к телефонным устройствам. Техническим результатом является обеспечение улучшенного качества звука при использовании элемента "громкой" связи и гибкость в проектировании трубки.

Изобретение относится к области технологий сетевой связи, а именно к передаче данных на основе обнаружения скользящего перемещения. Технический результат заключается в обеспечении возможности избежать загрузки данных, не интересующих пользователя, т.е.

Изобретение относится к области мобильной радиосвязи, а именно к устройству вызова абонента посредством телефонного аппарата. Технический результат заключается в расширении функциональных возможностей мобильных телефонов путем обеспечения возможности звукового вызова натуральным звуком механического музыкального инструмента и визуального вызова механической анимацией движущейся фигурки.

Изобретение относится к сетевым технологиям, а именно к единому пользовательскому интерфейсу для обмена сообщениями, в котором пользовательский опыт стандартизируется независимо от типа сообщения и в котором ведутся журналы регистрации для каждого сообщения.

Изобретение относится к области мобильных устройств связи, таких как мобильные телефоны, в частности устройств и систем для распространения и работы с различными другими функциями, включая радиочастотную идентификацию.

Изобретение относится к средствам взаимодействия и управления пользователей со структурированной системой предоставления информации. Технический результат заключается в визуализации всего поля поискового процесса за счет ускорения и упрощения навигации и самих процессов выбора и управления.

Группа изобретений относится к медицинской технике. Беспроводная система кардиального контроля содержит ЭКГ-монитор и трубку сотового телефона.

Изобретение относится к области терминалов мобильной связи, а именно к сохранению телефонных номеров в адресной книге терминала. Технический результат заключается в обеспечении автоматического сохранения телефонного номера отправителя сообщения в случае, когда сообщение определяется как сообщение для информирования об изменении телефонного номера.

Изобретение относится к устройству и способу обработки информации, которые имеют функцию видеотелефона. Техническим результатом является обеспечение регистрации изображения в адресной книге путем сохранения видеоизображения, передаваемого от принимающей стороны во время вызова, используя функции видеотелефона, и путем регистрации после окончания вызова изображения в информации адресной книги, используя сохраненное видеоизображение.

Изобретение относится к сетям связи общего пользования с системами коммутации пакетов информации. .

Изобретение относится к способу извлечения предварительно определенных данных из непрерывного потока определяемых разговором записей, созданных аппаратурой телефонного обмена.

Изобретение относится к автоматическому устройству выдачи голосового извещения для автоматической передачи голосового извещения о сообщении абоненту, соединенному с коммутатором и, более конкретно, к устройству и способу автоматической передачи абоненту голосового извещения о сообщении с начала сообщения.

Изобретение относится к платежным системам, в которых предусмотрено использование смарт-карт и средств мобильной связи. Техническим результатом является обеспечение использования любого средства мобильной связи, использующего СИМ карту, при осуществлении платежей.
Наверх