Способ поиска и разметки данных информации

Изобретение относится к области обработки цифровых данных с помощью электрических устройств, в частности к средствам информационного поиска и структурам баз данных, а также к средствам обучения иностранным языкам. Технический результат - создание эффективного способа поиска и разметки данных информации, в частности, для реализации обучающей функции "повторения пройденного", основанного на индивидуальном подходе к обучению, достигается тем, что осуществляют ввод в компьютер данных электронных документов, выявление объектов электронных документов, подлежащих поиску в информационной системе, сравнение объектов электронных документов, подлежащих поиску в информационной системе, с объектами баз данных информационной системы, преобразование данных электронных документов посредством разметки объектов электронных документов, визуализацию электронных документов с размеченными объектами данных электронных документов, при этом перед вводом в компьютер данных электронных документов производят ввод объектов данных, подлежащих поиску в информационной системе, сравнение объектов данных, подлежащих поиску в информационной системе с объектами данных баз данных информационной системы и формирование буферной базы объектов данных, при этом сравнение объектов электронных документов, подлежащих поиску в информационной системе, производят с объектами данных в буферной базе объектов данных. 16 з.п. ф-лы.

 

Изобретение относится к области обработки цифровых данных с помощью электрических устройств, в частности к средствам информационного поиска и структурам баз данных, специально предназначенным для специфических функций, а также к средствам обучения, в частности, иностранным языкам.

Известны способы поиска данных информации, включающие ввод в компьютер данных электронных документов, подлежащих поиску в информационной системе, анализ данных электронных документов с выявлением объектов данных, сравнение выявленных объектов данных с фиксированными объектами данных в базах данных информационной системы, и визуализацию фиксированных объектов данных (см., например, RU № 99115413 G 09 B 19/06, 2001 г.).

Известные способы не используют разметку электронного документа данными результата поиска, что в конечном итоге исключает их сопоставление для целей обучения.

Более совершенным и наиболее близким аналогом заявляемому техническому решению являются способ поиска и разметки данных информации, включающий ввод в компьютер данных электронных документов, выявление объектов электронных документов, подлежащих поиску в информационной системе, сравнение объектов электронных документов, подлежащих поиску в информационной системе, с объектами баз данных информационной системы, преобразование данных электронных документов посредством разметки объектов электронных документов, подлежащих поиску в информационной системе, и визуализацию электронных документов с размеченными объектами данных электронных документов (RU №2177174 G 06 F 17/30, 2001 г.).

Однако при применении известного способа для целей обучения не предусмотрено повторение пройденного материала с учетом индивидуальных особенностей усвоения, что в конечном итоге снижает эффективность учебного процесса.

Задачей, на решение которой направлено заявляемое техническое решение, является создание эффективного средства поиска и разметки данных информации, в частности, для целей обучения.

Технический результат, который может быть получен при осуществлении заявленного способа, заключается в реализации обучающей функции "повторения пройденного" основанного на индивидуальном подходе к обучению.

Указанный технический результат достигается способом поиска и разметки данных информации, включающим ввод в компьютер данных электронных документов, выявление объектов электронных документов, подлежащих поиску в информационной системе, сравнение объектов электронных документов, подлежащих поиску в информационной системе, с объектами баз данных информационной системы, преобразование данных электронных документов посредством разметки объектов электронных документов и визуализацию электронных документов с размеченными объектами данных электронных документов, за счет того, что перед вводом в компьютер данных электронных документов производят ввод объектов данных, подлежащих поиску в информационной системе, сравнение объектов данных, подлежащих поиску в информационной системе с объектами данных баз данных информационной системы и формирование буферной базы объектов данных, при этом сравнение объектов электронных документов, подлежащих поиску в информационной системе, производят с объектами данных в буферной базе объектов данных

А также за счет того, что сравнение объектов, подлежащих поиску в информационной системе, с объектами баз данных информационной системы и объектами в буферной базе объектов данных осуществляют посредством поиска объектов электронных документов, подлежащих поиску в информационной системе, в объектах баз данных информационной системы и в объектах буферной базы объектов данных.

А также за счет того, что сравнение объектов, подлежащих поиску в информационной системе, с объектами баз данных информационной системы и объектами буферной базы объектов данных осуществляют посредством поиска объектов баз данных информационной системы и буферной базы объектов данных в объектах данных электронных документов, подлежащих поиску в информационной системе.

А также за счет того, что совокупность объектов данных в буферной базе объектов данных ограничивают с возможностью изменения заданным количеством объектов данных и динамически обновляют.

А также за счет того, что объекты данных в буферной базе объектов данных сравниваемые с объектами данных электронных документов динамически обновляют методом "первым вошел - первым вышел".

А также за счет того, что совокупность объектов, сравниваемых с объектами данных электронных документов динамически обновляемых методом "первым вошел - первым вышел", ограничивают заданным количеством объектов с возможностью его изменения, отличающимся от количества объектов в буферной базе объектов данных.

А также за счет того, что объекты в буферной базе объектов данных, сравниваемые с объектами данных электронных документов, динамически обновляют методом "последним вошел - первым вышел".

А также за счет того, что совокупность объектов, сравниваемых с объектами данных электронных документов, динамически обновляемых методом "последним вошел - первым вышел", ограничивают заданным с возможностью изменения количеством объектов, отличающимся от количества объектов в буферной базе объектов данных.

А также за счет того, что объекты в указанной буферной базе объектов данных, сравниваемые с объектами данных электронных документов, динамически обновляют с чередованием метода "первым вошел - первым вышел" и метода "последним вошел - первым вышел".

А также за счет того, что указанную буферную базу объектов данных, формируют с разделением ресурса на массивы данных, обеспечивающих раздельный и идентифицированный доступ к объектам.

А также за счет того, что в базах данных объектам данных сопоставляют связанные данные, дополняемые операндами прикладных компьютерных программ и визуализируют связанные данные в качестве всплывающего контекста данных электронных документов

А также за счет того, что в качестве прикладных компьютерных программ используют программы доступа к просмотру электронных документов и данных в информационной сети, при этом упомянутые связанные данные дополняют унифицированным указателем информационного ресурса сети.

А также за счет того, что ввод в компьютер данных электронных документов, выявление объектов электронных документов, подлежащих поиску в информационной системе, сравнение объектов, подлежащих поиску в информационной системе с объектами в буферной базе объектов данных, разметку объектов электронных документов, запуск последовательности исполнения и исполнение прикладных компьютерных программ, а также визуализацию связанных данных и/или данных информационных ресурсов сети осуществляют одной процедурой.

А также за счет того, что объекты данных, подлежащих поиску в информационной системе, вводят в компьютер в отдельном окне панели задач или панели меню операционной системы независимо от наличия открытых окон операционной системы, поддержания конкретного окна в фокусе операционной системы, наличия текста в фокусном окне операционной системы; возможности ввода или выделения текста в открытом фокусном окне операционной системы.

А также за счет того, что перед преобразованием данных электронных документов посредством разметки объектов электронных документов, подлежащих поиску в информационной системе, производят переформатирование данных электронных документов из исходного формата в формат, позволяющий размещать разметку.

А также за счет того, что выявление объектов электронных документов, подлежащих поиску в информационной системе, осуществляют посредством аппаратно-программного лингвистического анализа данных электронных документов.

В данном определении сущности заявляемого технического решения подразумевается следующее толкование терминов:

данные - информация представленная в форме, воспринимаемой для формальной обработки автоматическими устройствами,

объекты - знаковые отображения элементов и/или параметров и/или атрибутов и/или отношений данных,

массив объектов данных - набор последовательно организованных на логическом уровне данных одинакового типа, предназначенный для работы с ним в памяти прямого доступа,

база данных - совокупность данных, организованных по определенным правилам, предусматривающим независимость от обрабатывающих программ, общие принципы описания, хранения и манипулирования,

буферная база объектов данных - поле памяти, предназначенное для согласования данных и событий выполнения процедур сравнения данных,

информационная система - совокупность электронно-вычислительных машин, связанных системой передачи данных и средствами связи для доступа абонентов к вычислительным ресурсам сети,

электронные документы - текстовые представления данных,

аппаратно-программный лингвистический анализ - функционирование вычислительного устройства в соответствии с алгоритмом, описанным, например, в "Development of a Stemming Algorithm" (Julie Beth Lovins, Mechanical Translation and Computational Linguistics, 11, 22-31, 1968),

разметка - языковая конструкция для обозначения доступа к информационному ресурсу, выделяется при визуализации в тексте цветом, подчеркиванием или другими известными способами, содержит всплывающий контекст (меню) со списком комментариев и/или гиперссылок, используется технология SmartTag или/и ToolTip или/и Hint операционной системы MS Windows и/или JavaScript или/и РНР или/и ASP или/и DHTML и/или другая известная технология гипертекстовой разметки электронных документов,

унифицированный указатель информационного ресурса - адрес URL (uniform resource locator), синтаксис которого определен в RFC 2396 либо как абсолютный адрес URI (absolute URI), имеющий характерный синтаксис (generic URI syntax) вида<scheme>://<authority><path>?<query>), или как относительный адрес URI (relative URI syntax), имеющий синтаксис вида (net_path|abs__path|rel_path) ["?" query], либо может соответствовать и другим аналогичным требованиям, например, описанным в RFC 3401-3406 реализации DDDS адресации;

связанные данные - данные, имеющие с объектами данных связь, устанавливающуюся при вызове программы,

программа доступа к просмотру электронных документов и данных в информационной сети - программа типа браузер, например, Microsoft Internet Explorer или Netscape Navigator,

прикладная компьютерная программа - программа для решения задачи (задач) в определенной области применения систем обработки данных,

операнд - языковая конструкция, обозначающая ссылку в машинной команде на запуск компьютерных программ,

процедура - множественная операция, реализация которой обеспечивается системой программирования, что делает ее одинаково доступной и с одинаковым смыслом.

Работа по поиску и разметке данных информации согласно заявляемому способу, например, при обучении иностранному языку и переводе текста с использованием электронного словаря, осуществляются следующим образом.

Пользователь перед вводом в компьютер данных электронных документов Ошибка! Источник ссылки не найден. производит ввод объектов данных, подлежащих поиску в информационной системе (например, требующие перевода), сравнение объектов данных, подлежащих поиску в информационной системе с объектами данных баз данных информационной системы (например, в базе данных переводов слов и словосочетаний электронного словаря МультиЛекс™) и формирование буферной базы объектов данных (например, история ввода пользователем слов и словосочетаний, требующих перевода), где совокупность объектов данных ограничивают с возможностью изменения заданным количеством объектов данных и динамически обновляют (например, путем добавления слов и словосочетаний, вновь введенных пользователем).

Примером ввода пользователем объектов данных может служить ввод слов или словосочетаний или фрагмента текста посредством мыши или клавиатуры, например:

- используя функцию "выделения текста", при этом выделяют слово или словосочетание или фрагмент в тексте документа и вызывают процедуру сравнения введенных объектов или

- вводят путем печати на клавиатуре или путем копирования и вставки (copy & paste) или "перетаскивают" (drag & drop) слово или словосочетание в фокусное окно операционной системы и вызывают процедуру сравнения введенных объектов,

- с помощью ввода в окно Tool Bar или/и Tool Band или/и Desk Band операционной системы MS Windows(или с использованием другого известного способа.

Примером вызова процедуры сравнения может служить вызов процедуры сравнения путем нажатия "горячей" клавиши перевода электронного словаря МультиЛекс™, или запуск процедуры сравнения из командной строки операционной системы, или другой известный способ запуска процедуры сравнения.

Примером буферной базы данных может служить память истории переводов словаря МультиЛекс™, а примером формирования буферной базы данных может служить запись слов и словосочетаний, переведенных пользователем в память истории переводов словаря МультиЛекс™.

В упомянутой буферной базе организацией данных может быть предусмотрено наличие, по меньшей мере, одного объекта (например, одного слова из множества слов находящихся в буфере) в виде алфавитно-цифровой последовательности символов, не являющихся словом или словосочетанием. Признаком конца такой последовательности (или слова) при вводе служат знаки препинания, пробелы или/и другие символы разделения, используемые при форматировании текстовой или/и табличной информации. Кроме того, в упомянутой буферной базе объектов данных организацией данных должно быть предусмотрено, что каждому объекту (например, слову или словосочетанию) ничто не поставлено в соответствие, или поставлена в соответствие процедура формирования данных (например, перевода), или поставлены в соответствие сами связанные данные (например, перевод), или поставлен в соответствие адрес связанных данных (например, перевода слова или словосочетания в базе данных переводов), или поставлена в соответствие процедура формирования адреса размещения связанных данных (например, адреса размещения перевода слова или словосочетания в базе данных переводов), при этом объекты размещают в хронологическом порядке поиска, или в алфавитном, или в другом порядке. Упомянутая буферная баз может быть установлена на сервере в сети информационной системы или на терминале пользователя.

После этого Пользователь единой процедурой осуществляет ввод в компьютер данных электронных документов (например, вызывает для просмотра в браузере текстовую страницу Интернет), выявление объектов данных электронного документа, подлежащих поиску в информационной системе (например слов и словосочетаний) и сравнение выявленных объектов данных электронных документов, подлежащих поиску в информационной системе, с объектами данных в буферной базе объектов данных (например, со словами и словосочетаниями размещенными в памяти истории переводов словаря МультиЛекс™, организованными как база данных информационной системы) или/и с объектами баз данных информационной системы (например, в словаре МультиЛекс™ (со словами и/или словосочетаниями, организованными как база данных информационной системы). При реализации этой единой процедуры, в частности, перед просмотром доступных пользователю электронных документов, возможно, содержащих объекты, требующие повторного толкования или перевода, выявление объектов электронных документов, подлежащих поиску в информационной системе, может быть осуществлено посредством разбиения данных на группы алфавитно-цифровых последовательностей, разделенных знаками конца последовательности (например, слова или словосочетания или другие объекты, разделенные пробелами, знаками препинания или/и другими символами разделения) или посредством аппаратно-программного лингвистического анализа данных электронных документов, в процессе которого документы разбиваются на слова и/или словосочетания, или объекты данных могут быть использованы в исходном виде, при этом поисковым запросом служит очередное слово или словосочетание или фрагмент текста или весь текст документа.

Общеизвестным является тот факт, что обучение иностранному языку, терминологии, как и обучение вообще, в значительной степени построено на повторении пройденного материала. Вместе с тем, разные люди по разному воспринимают и усваивают пройденный материал и поэтому уровень знания материала пройденного двумя разными учениками одного класса всегда отличен и индивидуален. Именно поэтому повторение одного и того же списка пройденных слов не может быть одинаково эффективным способом обучения для всех учеников одного класса. Для обеспечения реализации обучающей функции "повторения пройденного" основанного на индивидуальном подходе к обучению перед сравнением объектов электронных документов, подлежащих поиску в информационной системе с объектами баз данных информационной системы проводят сравнение упомянутых объектов с объектами данных в буферной базе объектов данных, причем совокупность объектов данных в буферной базе объектов данных, сравниваемых с объектами данных электронных документов, могут ограничивать с возможностью изменения заданным количеством объектов и динамически обновляют.

Все или часть объектов данных в буферной базе объектов данных, сравниваемых с объектами данных электронных документов, динамически обновляют методом "первым вошел - первым вышел" (метод FIFO - "очередь"), либо методом "последним вошел - первым вышел" (метод LIFO - "стек"), либо с чередованием указанных методов.

Посредством управляющей программы объектам данных, подлежащим поиску в информационной системе, сопоставляют объекты данных буферной базы объектов данных (например, слова и выражения в буферных словарях), при обнаружении доказательства истинности (совпадения полностью или частично) включают и исполняют механизм преобразования объектов данных электронных документов во взаимосвязанную совокупность данных электронных документов посредством разметки объектов данных электронных документов связанными данными объектов буферной базы данных, совпадающих полностью или частично с выявленными объектами буферной или другой базы данных информационной системы, отличной от буферной базы объектов данных. Связанные данные могут быть дополнены операндами других прикладных компьютерных программ, способных обработать поисковый запрос, и/или гиперссылками. Примером упомянутых операндов может служить, в частности, вызов прикладной компьютерной программы озвучивания выделенного разметкой слова или его перевода, а примером гиперссылок может служить размещение адреса URL (uniform resource locator) в языковой конструкции разметки. Параметр такого вызова может содержать само слово или словосочетание электронного документа, размеченное таким комментарием и подлежащее "озвучиванию".

Введенные пользователем объекты данных, подлежащие поиску в информационной системе при формировании буферной базы данных могут быть дополнены сопутствующими данными в виде совокупности данных электронного документа, включающей объект данных и данные электронного документа, характеризующие применение такого объекта данных электронного документа (например, в словарях сопутствующие объекты данных могут быть представлены примером употребления слова в контексте его перевода или примером толкований слов и/или словосочетаний, в частности и на языке исходного электронного документа).

Перед упомянутым преобразованием при необходимости производят переформатирование данных из исходного формата в формат (например DOC или HTML), позволяющий размещать в данных разметку. Еще одним полезным эффектом является то, что данная операция предусматривает возможность переформатирования потока электронных документов из "бедного" не поддерживающего гипертекстовую разметку формата в "богатый" гипертекстовый формат, с целью размещения в исходном электронном документе информации, например, о переводе и/или толковании.

Сравнение объектов, подлежащих поиску в информационной системе, с объектами баз данных информационной системы и/или объектами в буферной базе объектов данных осуществляют посредством поиска объектов электронных документов, подлежащих поиску в информационной системе, в объектах баз данных информационной системы и/или в объектах буферной базы объектов данных либо посредством поиска объектов баз данных информационной системы и/или буферной базы объектов данных в объектах данных электронных документов, подлежащих поиску в информационной системе.

При отсутствии надлежащей информации в базе данных информационной системы и/или буферной базе объектов данных или соответственно желанию пользователя или соответственно предписанию процедуры или соответственно целям обработки данных в качестве компьютерных программ используют программы доступа к просмотру электронных документов и данных в информационной системе, при этом связанные данные дополняют унифицированным указателем информационного ресурса системы или другой системы и/или базы данных другой информационной системы. Примером таких действий может служить гиперссылка на сайт Интернет, предоставляющий услуги "купить", "починить", "продать" и другие в отношении, например, объекта "мобильный телефон". Другим примером таких действий может служить поиск информации о типе товара или услуги по его наименованию (торговой марке) в информационной системе и/или базе данных конкретного производителя или товарного знака в информационной системе и/или базе данных конкретного патентного ведомства и так далее, при этом связанными данными могут служить данные, связанные с использованием такого товара или услуги, информация о правообладателе товарного знака или другие данные патентного ведомства. Еще одной реализацией является размещение в окне поиска онлайновых словарей или переводчиков, таких как, например, http://multilex.mail.ru/ или http://online.multilex.ru/, контекстной рекламы продавцов различных товаров и услуг, купивших в рекламном агентстве слово или словосочетание. Так, например, получив запрос пользователя на поиск перевода английского слова "telephone", онлайновый ресурс перевода покажет пользователю Интернет перевод, а также рекламу продавца телефонов или мастерской по их ремонту. Реклама может быть контекстной не только в отношении переводимого слова, выражения или текста, но и в отношении самого пользователя. Например, существует техника определения географической принадлежности пользователя по IP адресу и в зависимости от этого может быть размещена контекстная реклама рекламодателя, географически близко размещенного к пользователю. Такая реклама может быть размещена в виде баннеров или reach media рекламы, такой как технология flash компании Macromedia (http://www.Macromedia.com) или другая, имея размер и формат, соответствующий требованиям страницы, например, перевода, причем материалы размещаются в предварительно отведенных для этого местах страницы перевода, соответствующих размерам и поддерживающих цифровой формат рекламных материалов.

При ограниченном количестве объектов в буферной базе объектов данных и обновлении методом "очередь" вновь введенный пользователем объект данных будет помещаться в память как слово №N в конец очереди и вымещать ранее введенный объект №1 со связанными данными из начала очереди, а при обновлении методом "стек" будет меняться только последний объект со связанными данными, оставляя нетронутыми предыдущие (N-1) объектов. Изменяя число N изучаемых пользователем из всего количества объектов в буферной базе объектов данных и метод обновления с целью "углубленного повторения" пройденного, пользователь получает возможность регулировать скорость обновления изучаемых объектов и таким образом регулировать продолжительность "повторения" ранее выявленных изучаемых объектов. Для разметки будут использованы только слова или словосочетания, размещенные в буферной базе объектов данных, которые будут выделяться в тексте гиперссылками, указывающими на перевод, команду озвучить слово, примеры применения слова и так далее или комментариями, содержащими перевод, команду озвучить слово, примеры применения слова и так далее.

Для использования пользователем истории обновления ранее введенных объектов (истории перевода) с любой доступной глубиной, совокупность объектов буферной базы, сравниваемых с объектами данных электронных документов и, динамически обновляемых либо методом "первым вошел - первым вышел" либо методом "последним вошел - первым вышел", ограничивают заданным с возможностью изменения количеством объектов, отличающимся от ограниченного количества объектов в указанной буферной базе.

В результате таких действий электронный документ будет преобразован в первую очередь с разметкой выявленных объектов связанными данными объектов буферной базы объектов данных и может быть дополнительно, но не обязательно, преобразован во вторую очередь - с разметкой объектами со связанными данными из баз данных информационной системы. Аналогичный эффект может быть достигнут и при сравнении объектов буферной базы объектов данных с объектами электронных документов одновременно с их выявлением.

Разметку данных в электронном документе производят гиперссылками на источник связанных или/и сопутствующих данных объекта (например, перевода или/и примеров употребления) или размечают самими связанными данными (например, переводами) по технологии подсказок Hint, ToolTip, SmartTag или технологии DHTML или JavaScript или ASP или РНР или с помощью другой известной технологии.

Электронный документ с разметкой упомянутыми связанными данными визуализируют, например, используя средства операционной системы MS Windows™ (или/и технологии plug-in или/и add-on к офисному программному обеспечению Microsoft Office™, а также визуализируют окно поискового запроса с кнопкой "поиск" или аналогичной ей по значению кнопкой, или только кнопку (без окна), размещенную на таком средстве визуализации и функционально эквивалентную "горячей клавише" поиска, при этом связанные данные визуализируют в качестве всплывающего контекста объектов данных, размеченных цветом, подчеркиванием или специальным всплывающим символом (например, для операционной системы MS Windows™ (подчеркивание слова и показ символа 'i' в круге означает, что слово размечено SmartTag) для привлечения на себя внимания пользователя. Указанный всплывающий комментарий позволяет визуализировать меню, содержащее список гиперссылок или/и комментариев возможных переводов или/и толкований или/и меню способов обработки слова или словосочетания размеченного в электронном документе, подлежащем визуализации.

При "активизации" контекста или объекта данных, например, с помощью курсора мыши или клавиатуры, пользователь повторно воспринимает информацию связанных данных (видит или/и слышит перевод или/и толкование слова, которое еще не освоил или видит команду перевода, толкования или озвучивания слова) и таким образом получает возможность "повторения пройденного", чем и достигается индивидуальный полезный эффект обучения. Достижению этого эффекта, например, в ситуациях с разными пользователями или в ситуациях с тематическим разделением информационного ресурса, способствует также и то, что буферную базу объектов данных формируют с разделением ресурса на массивы данных, обеспечивающих раздельный и идентифицированный доступ к данным объектов соответственно для разных пользователей или для разной тематики.

Для сокращения количества действий пользователя, необходимых для обработки данных электронных документов, подлежащих поиску в информационной системе, одной процедурой осуществляют совокупность действий, таких как ввод в компьютер данных электронных документов, выявление объектов электронных документов, подлежащих поиску в информационной системе, сравнение объектов, подлежащих поиску в информационной системе с объектами в буферной базе объектов данных, разметку объектов электронных документов, запуск последовательности исполнения и исполнение прикладных компьютерных программ, а также визуализацию связанных данных и/или данных информационных ресурсов сети при этом объекты данных, подлежащих поиску в информационной системе, вводят в компьютер в отдельном окне панели задач или панели меню операционной системы независимо от наличия открытых окон операционной системы, поддержания конкретного окна в фокусе операционной системы, наличия текста в фокусном окне операционной системы; возможности ввода или выделения текста в открытом фокусном окне операционной системы. Например, после ввода поискового запроса следует нажать кнопку "поиск" чтобы найти, например, перевод введенного слова. Причем место, показанное как Tool Band (в панели инструментов конкретной программы для операционной системы MS Windows™) или Desk Band (в панели задач операционной системы MS Windows™) может выглядеть, например, как строка ввода адреса Интернет в браузере с такой же клавишей "GO" или по-другому, так, как захочет программист.

Существенность такой специфики для достижения технического результата видна на примере использования упомянутой процедуры при пользовании Электронным словарем МультиЛекс™ (версии 4.0 (www.multilex.ru), где пользователь не имеет возможности для реализации функции "всплывающего перевода" по технологии Tool Bar или/и Tool Band или/и Desk Band, если на экране нет окна с текстом, если окно не находится в фокусе работы операционной системы, или если текст в окне не доступен для "выделения" с последующим копированием в clipboard по каким-то причинам. Кроме того, пользователь словаря не может осуществить поиск выделенного объекта в сети Интернет или других базах данных, так как существующая реализация "всплывающего перевода" позволяет осуществлять поиск только в упомянутом словаре, а "всплывающий перевод" не достаточно "интеллектуален" и не способен обрабатывать вызовы на исполнение других программ.

Объединение одной процедурой нескольких действий в заявляемом способе позволяет устранить все указанные недостатки существующей технологии электронного словаря, а именно позволяет при вводе с клавиатуры и показывать вводимый текст в отдельном окне панели задач или панели меню операционной системы MS Windows™ (и таких программ как MS Internet Explorer™, MS Word™ (и других независимо от а) наличия открытых окон операционной системы, б) поддержания конкретного окна в фокусе операционной системы, в) наличия текста в фокусном окне операционной системы и г) возможности ввода или выделения текста в открытом фокусном окне операционной системы.

Объединение одной процедурой нескольких действий в заявляемом способе предоставляет возможность установить последовательность вызова компьютерных программ обработки данных. Например, если в процедуре установлено в качестве первоочередной обработка программой электронного словаря МультиЛекс введенных пользователем данных, то при нажатии "горячей клавиши" процедура будет вызывать на исполнение первой программу МультиЛекс и передавать ей введенные пользователем данные как слова для перевода, а результатом работы процедуры будет "всплывающий перевод" введенных или выделенных слов. При этом, если программа электронного словаря МультиЛекс не способна обработать запрос (например, объект не имеет перевода), то процедура будет последовательно передавать управление другим программам, пока одна из таких программ не позволит корректно обработать введенные данные. В примере с адресом Интернет такой программой будет Интернет браузер, например MS Internet Explorer™, а если введенными пользователем данными является e-mail адрес name@multilex.ru, то управление будет передано программе создания сообщения электронной почты и так далее.

Наконец еще одним преимуществом объединения одной процедурой нескольких действий является возможность реализации компьютерной программы поиска, перехвата, анализа и разметки, которая позволяет сократить количество действий пользователя, необходимых для обработки вводимой им текстовой информации, а также позволяет повысить степень "интеллектуальности" компьютерной программы перевода и/или электронных словарей и расширить их функциональные возможности. Программа может быть частью электронного словаря и обеспечивать перехват данных ввода пользователя с клавиатуры или из промежуточной памяти (clipboard), анализ и интерпретацию введенных данных, определение программы, отвечающей за обработку введенных данных, вызов на исполнение соответствующей компьютерной программы и передачу ей данных для обработки. Программа может быть установлена на сервере в сети информационной системы или на терминале пользователя.

Такая компьютерная программа будет выполнять функцию слежения за вводом с клавиатуры и функцию хранения в буфере памяти терминала ограниченного множества слов поискового запроса, извлекает из буфера, по меньшей мере, одно из находящихся в буфере слов и формирует поисковый запрос к одной или нескольким поисковым системам или/и массивам или/и базам данных. Это позволяет пользователю осуществить ввод объектов подлежащих поиску в базах данных информационной системы.

Упомянутая программа будет иметь функцию постоянной замены находящихся в буферной базе объектов данных слов вновь введенными по правилу "очередь" или "стек", а в качестве поискового запроса программа использует содержимое буферной базы объектов данных на момент нажатия "горячей клавиши" поиска. Упомянутая программа будет иметь также функцию слежения за поступлением в промежуточную память операционной системы (clipboard) данных, скопированных пользователем из доступных ему электронных документов, а также будет иметь функцию копирования скопированных пользователем данных из промежуточной памяти (clipboard) в буфер памяти поискового запроса терминала.

Указанная программа позволит интерпретировать поисковый запрос как адрес Интернет; как слово или словосочетание для перевода или/и толкования; или как имя команды для операционной системы; или как имя команды для определенной пользователем компьютерной программы; или как данные поискового запроса к одной или нескольким поисковым машинам Интернет или одной или нескольким базам данных информационной системы; или как поисковый запрос на поиск данных в локальной сети или сети экстранет или сети интранет. Обработка этого запроса будет иметь возможность настройки, которая доступна пользователю или/и администратору терминала или/и сервера, причем настройка позволит установить очередность вызова других программ для обработки поискового запроса по установленному порядку следования или/и по степени соответствия содержания поискового запроса (объекта, подлежащего поиску в базах данных информационной системы) функциональности вызываемой программы.

Алгоритм указанной программы должен быть составлен исходя из условия наполнения буферной базы объектов данных объектами (данными истории переводов) всякий раз, когда пользователь, исполняя функцию "первичного обучения", производит поиск перевода в базе данных переводов, а при просмотре электронных документов на терминале пользователя перед их визуализацией программно осуществляют следующее:

- производят перехват электронного документа перед его визуализацией пользователю;

- или производят лингвистический анализ электронного документа или не производят лингвистического анализа, разбивая электронный документ на последовательность отдельных слов и/или словосочетаний и формируют последовательные поисковые запросы поиска слова или словосочетания к буферной базе объектов данных, используя слова или словосочетания, полученные в процессе разбивки электронного документа;

- или извлекают из буферной базы объектов данных список переведенных ранее слов и/или словосочетаний и ищут в электронном документе слова и/или словосочетания, совпадающие с, по меньшей мере, одним из слов и/или словосочетаний буферной базы объектов данных,

- если найдено совпадение, по меньшей мере, одного слова и/или словосочетания электронного документа и объектов в буферной базе объектов данных, то

- либо извлекают соответствующий слову или словосочетанию перевод или адрес перевода из буферной базы объектов данных или ищут перевод в иных базах данных переводов;

- снабжают соответствующее слово или словосочетание, содержащееся в электронном документе, всплывающим комментарием, содержащим перевод слова и/или словосочетания,

- или/и размечают соответствующее слово или словосочетание электронного документа гиперссылкой, содержащей адрес базы данных переводов, или множественной гиперссылкой, содержащей список гиперссылок;

- передают размеченный всплывающими комментариями и/или гиперссылками электронный документ для визуализации пользователю;

- визуализируют размеченный электронный документ на дисплее терминала.

Если база данных переводов содержит рекламу в виде баннеров и других рекламных материалов, поставленных в соответствие по меньшей мере одному слову или/и словосочетанию буферной базы объектов данных, при поиске перевода в базе данных переводов программа должна дополнительно выполнять шаги по:

- поиску в базе данных переводов или в специализированной рекламной базе данных рекламных материалов, соответствующих введенному пользователем слову, или словосочетанию, или тексту,

- размещению найденных в базе данных рекламных материалов в окне перевода перед его визуализацией пользователю.

1. Способ поиска и разметки данных информации, включающий ввод в компьютер данных электронных документов, выявление объектов электронных документов, подлежащих поиску в информационной системе, сравнение объектов электронных документов, подлежащих поиску в информационной системе, с объектами баз данных информационной системы, преобразование данных электронных документов посредством разметки объектов электронных документов и визуализацию электронных документов с размеченными объектами данных электронных документов, отличающийся тем, что перед вводом в компьютер данных электронных документов производят ввод объектов данных, подлежащих поиску в информационной системе, сравнение объектов данных, подлежащих поиску в информационной системе с объектами данных баз данных информационной системы и формирование буферной базы объектов данных, при этом сравнение объектов электронных документов, подлежащих поиску в информационной системе, производят с объектами данных в буферной базе объектов данных.

2. Способ по п.1, отличающийся тем, что сравнение объектов, подлежащих поиску в информационной системе, с объектами баз данных информационной системы и объектами в буферной базе объектов данных осуществляют посредством поиска объектов электронных документов, подлежащих поиску в информационной системе, в объектах баз данных информационной системы и в объектах буферной базы объектов данных.

3. Способ по п.1, отличающийся тем, что сравнение объектов, подлежащих поиску в информационной системе, с объектами баз данных информационной системы и объектами буферной базы объектов данных осуществляют посредством поиска объектов баз данных информационной системы и буферной базы объектов данных в объектах данных электронных документов, подлежащих поиску в информационной системе.

4. Способ по п.1, отличающийся тем, что совокупность объектов данных в буферной базе объектов данных ограничивают с возможностью изменения заданным количеством объектов данных и динамически обновляют.

5. Способ по п.1, отличающийся тем, что совокупность объектов данных в буферной базе объектов данных, сравниваемых с объектами данных электронных документов, ограничивают с возможностью изменения заданным количеством объектов и динамически обновляют.

6. Способ по п.4 или 5, отличающийся тем, что объекты данных в буферной базе объектов данных, сравниваемые с объектами данных электронных документов, динамически обновляют методом "первым вошел - первым вышел".

7. Способ по п.6, отличающийся тем, что совокупность объектов, сравниваемых с объектами данных электронных документов, динамически обновляемых методом "первым вошел - первым вышел", ограничивают заданным количеством объектов с возможностью его изменения, отличающимся от количества объектов в буферной базе объектов данных.

8. Способ по п.4, отличающийся тем, что объекты в буферной базе объектов данных, сравниваемые с объектами данных электронных документов, динамически обновляют методом "последним вошел - первым вышел".

9. Способ по п.8, отличающийся тем, что совокупность объектов, сравниваемых с объектами данных электронных документов, динамически обновляемых методом "последним вошел - первым вышел", ограничивают заданным с возможностью изменения количеством объектов, отличающимся от количества объектов в буферной базе объектов данных.

10. Способ по п.4 или 5, отличающийся тем, что объекты в указанной буферной базе объектов данных, сравниваемые с объектами данных электронных документов, динамически обновляют с чередованием метода "первым вошел - первым вышел" и метода "последним вошел - первым вышел".

11. Способ по п.1, отличающийся тем, что указанную буферную базу объектов данных формируют с разделением ресурса на массивы данных, обеспечивающих раздельный и идентифицированный доступ к объектам.

12. Способ по п.1, отличающийся тем, что в базах данных объектам данных сопоставляют связанные данные, дополняемые операндами прикладных компьютерных программ, и визуализируют связанные данные в качестве всплывающего контекста данных электронных документов.

13. Способ по п.12, отличающийся тем, что в качестве прикладных компьютерных программ используют программы доступа к просмотру электронных документов и данных в информационной системе, при этом упомянутые связанные данные дополняют унифицированным указателем информационного ресурса сети.

14. Способ по п.13, отличающийся тем, что ввод в компьютер данных электронных документов, выявление объектов электронных документов, подлежащих поиску в информационной системе, сравнение объектов, подлежащих поиску в информационной системе с объектами в буферной базе объектов данных, разметку объектов электронных документов, запуск последовательности исполнения и исполнение прикладных компьютерных программ, а также визуализацию связанных данных и/или данных информационных ресурсов сети осуществляют одной процедурой.

15. Способ по п.14, отличающийся тем, что объекты данных, подлежащих поиску в информационной системе, вводят в компьютер в отдельном окне панели задач или панели меню операционной системы независимо от наличия открытых окон операционной системы, поддержания конкретного окна в фокусе операционной системы, наличия текста в фокусном окне операционной системы; возможности ввода или выделения текста в открытом фокусном окне операционной системы.

16. Способ по п.1, отличающийся тем, что перед преобразованием данных электронных документов посредством разметки объектов электронных документов, подлежащих поиску в информационной системе, производят переформатирование данных электронных документов из исходного формата в формат, позволяющий размещать разметку.

17. Способ по п.1, отличающийся тем, что выявление объектов электронных документов, подлежащих поиску в информационной системе, осуществляют посредством аппаратно-программного лингвистического анализа данных электронных документов.



 

Похожие патенты:

Изобретение относится к распределительным устройствам, оконечным устройствам. .

Изобретение относится к устройствам для установления логических связей между множеством файлов данных, таких как файлы мировой системы Интернет. .

Изобретение относится к вычислительной технике, в частности к автоматизированной системе контроля избирательных фондов ГАС "Выборы". .

Изобретение относится к индексной структуре метаданных, предусмотренной для поиска информации о содержании. .

Изобретение относится к области информатики и вычислительной техники и может быть использовано в устройствах контроля информационных потоков с целью мониторинга информационного трафика.

Изобретение относится к вычислительной технике, в частности к информационно-справочной системе производственно-экономических показателей авиаперевозок. .

Изобретение относится к вычислительной технике, в частности к автоматизированной системе управления маршрутизацией текстовых документов в сети обработки данных. .

Изобретение относится к области вычислительной техники и может быть использовано в качестве устройства для структурно-статистического анализа информационных массивов.

Изобретение относится к автоматизированным библиотекам для хранения данных с загрузкой, разгрузкой и перемещением носителей данных. .

Изобретение относится к области вычислительной техники и может быть использовано в качестве устройства для структурно-статистического анализа информационных массивов

Изобретение относится к вычислительной технике, в частности к системе управления распределением данных в сети информационно-аналитического центра коммерческого блока аэрокомпании

Изобретение относится к вычислительной технике, в частности к системе поддержания информационной идентичности территориально-распределенных баз данных авиакомпании

Изобретение относится к области вычислительной техники, в частности к автоматизированной системе сбора и обработки данных электронного голосования

Изобретение относится к средствам информационного поиска и структурам баз данных

Изобретение относится к системам связи, в частности к способу сохранения географической информации в узле связи

Изобретение относится к статистическим моделям языка, используемых в системах распознавания речи

Изобретение относится к синтаксическому анализу потока битов, содержащего данные, которые имеют структуру и содержимое, соответствующие некоторому формату, и предназначен для формирования древовидного представления упомянутого потока

Изобретение относится к области электросвязи и может быть использовано для поиска и оперативной идентификации информации в мультисервисных цифровых сетях передачи данных с коммутацией пакетов

Изобретение относится к техническим средствам информатики и вычислительной техники и может быть использовано для решения задач по составлению словарей, справочников, а также по созданию баз данных
Наверх