Команда для загрузки данных до заданной границы памяти, указанной командой

Изобретение относится к области обработки данных. Техническим результатом является повышение эффективности загрузки данных в регистры. Способ выполнения машинной команды в центральном процессорном устройстве содержит получение процессором машинной команды для выполнения, причем машинная команда определена для выполнения компьютером согласно архитектуре компьютера и включает: по меньшей мере одно поле кода операции для предоставления кода операции, причем код операции идентифицирует операцию загрузки до границы блока; поле регистра, используемое для обозначения регистра, причем регистр включает первый операнд; по меньшей мере одно поле для обнаружения второго операнда в основной памяти; и указатель размера границы блока для указания заданной границы блока второго операнда; и выполнение машинной команды, включающее: загрузку переменного количества данных из блока второго операнда в первый операнд с обеспечением загрузки в первый операнд только данных, которые находятся внутри блока, причем загрузка из блока начинается с предоставляемого машинной командой начального адреса в блоке второго операнда и заканчивается на заданной границе блока второго операнда или до нее. 3 н. и 20 з.п. ф-лы, 16 ил.

 

Предпосылки создания изобретения

[001] Аспект данного изобретения относится, в общем, к обработке данных, и в частности к загрузке данных в регистры.

[002] Обработка данных включает в себя различные типы обработки, в том числе загрузку данных в регистры. Загрузка данных в регистр включает, но не ограничивается, загрузкой символьных данных, таких как строки символьных данных; целочисленных данных, или любых других типов данных. После этого, загруженные данные становятся пригодными для их использования и/или манипулирования ими.

[003] Существующие на данный момент команды для выполнения различных типов обработки, в том числе загрузки данных в регистры, зачастую являются неэффективными.

РАСКРЫТИЕ ИЗОБРЕТЕНИЯ

[004] Для устранения недостатков уровня техники предложен машиночитаемый носитель данных, в котором хранятся команды, считываемые и выполняемые обрабатывающим устройством в центральном процессорном устройстве для выполнения способа, включающего получение процессором машинной команды для выполнения, причем машинная команда определена для выполнения компьютером согласно архитектуре компьютера и включает: по меньшей мере одно поле кода операции для предоставления кода операции, причем код операции идентифицирует операцию загрузки до границы блока; поле регистра, используемое для обозначения регистра, причем регистр включает первый операнд; по меньшей мере одно поле для обнаружения второго операнда в основной памяти; и указатель размера границы блока для указания заданной границы блока второго операнда. Вышеупомянутый способ также включает выполнение машинной команды, включающее загрузку переменного количества данных из блока второго операнда в первый операнд с обеспечением загрузки в первый операнд только данных, которые находятся внутри блока, причем загрузка из блока начинается с предоставляемого машинной командой начального адреса в блоке второго операнда и заканчивается на заданной границе блока второго операнда или до нее.

[005] Также предложены соответствующие способ и компьютерная система.

[006] С помощью методик согласно данному изобретению реализуются и другие особенности и преимущества. Другие варианты воплощения и аспекты изобретения излагаются здесь подробно и считаются частью формулы изобретения.

КРАТКОЕ ОПИСАНИЕ И НЕСКОЛЬКО ПРЕДСТАВЛЕНИЙ ЧЕРТЕЖЕЙ

[007] Один или более аспектов данного изобретения выделены особо и явно заявлены как примеры в формуле изобретения в конце описания. Вышеуказанное и другие цели, признаки и преимущества изобретения понятны из следующего подробного описания с помощью сопровождающих чертежей, в которых:

На ФИГ. 1 изображен один из примеров вычислительной среды, включающей и использующей один или более аспектов данного изобретения;

На ФИГ.2А изображен другой пример вычислительной среды, включающей и использующей один или более аспектов данного изобретения;

На ФИГ.2Б изображены дополнительные подробности памяти ФИГ.2а в соответствии с аспектом настоящего изобретения;

На ФИГ.3 изображен один из вариантов воплощения формата команды Vector Load To Block Boundary (загрузить вектор до границы блока) в соответствии с аспектом настоящего изобретения;

На ФИГ.4 изображен один из вариантов воплощения логики, связанной с командой Vector Load to Block Boundary в соответствии с аспектом данного изобретения;

На ФИГ.5 изображен один из примеров данных для загрузки в векторный регистр в соответствии с аспектом данного изобретения;

На ФИГ.6 изображен пример файла регистра в соответствии с аспектом данного изобретения;

На ФИГ.7 изображен один из вариантов воплощения компьютерного программного продукта, включающего один или более аспектов данного изобретения;

На ФИГ.8 изображен один из вариантов воплощения главной компьютерной системы, включающей и использующей один или более аспектов данного изобретения;

На ФИГ.9 изображен другой пример компьютерной системы, включающей и использующей один или более аспектов данного изобретения;

На ФИГ.10 изображен еще один пример компьютерной системы, содержащей компьютерную сеть, включающую и использующую один или более аспектов данного изобретения;

На ФИГ.11 изображен один из вариантов воплощения различных элементов компьютерной системы, включающей и использующей один или более аспектов данного изобретения;

На ФИГ.12А изображен один из вариантов воплощения исполнительного устройства компьютерной системы согласно ФИГ.11, включающего и использующего один или более аспектов данного изобретения;

На ФИГ.12Б изображен один из вариантов воплощения устройства ветвления компьютерной системы согласно ФИГ.11, включающего и использующего один или более аспектов данного изобретения;

На ФИГ.12В изображен один из вариантов воплощения устройства загрузки/сохранения компьютерной системы согласно ФИГ.11, включающего и использующего один или более аспектов данного изобретения; и

На ФИГ.13 изображен один из вариантов воплощения эмулируемой хост-компьютерной системы, включающей и использующей один или более аспектов данного изобретения.

ПОДРОБНОЕ ОПИСАНИЕ

[008] В соответствии с аспектом данного изобретения предоставляется возможность для облегчения загрузки данных в регистр. К примеру, данные включают символьные данные, целые данные и/или другие типы данных. Кроме того, регистр является векторным регистром или другим типом регистра.

[009] Символьные данные включают, но не ограничиваются: алфавитные символы на любом языке; числовые цифры; знаки препинания; и/или другие символы. Символьные данные могут быть или не быть строками данных. С символьными данными связаны стандарты, примеры которых включают, но не ограничиваются: ASCII (American Standard Code for Information Interchange, американский стандартный код для информационного обмена); Unicode, включая, но не ограничиваясь, UTF (Unicode Transformation Format, формат трансформации Юникода) 8; UTF16 и т.п.

[0010] Векторный регистр (также называемый вектором) включает один или более элементов, а каждый элемент имеет длину, например, один, два или четыре байта. Далее, векторный операнд является, к примеру, операндом типа SIMD (Single Instruction, Multiple Data - одна команда, много данных), имеющим множество элементов. В других вариантах реализации элементы могут иметь другие размеры; а векторный операнд не обязательно типа SIMD, и/или может включать один элемент.

[0011] В одном примере предоставляется команда Vector Load to Block Boundary, которая загружает переменное количество байт данных из памяти в векторный регистр, в то же время гарантируя, что заданная граница памяти, из которой данные загружаются, не пересекается. Граница может быть задана командой явно (напр., значение переменной в тексте команды, фиксированное значение в тексте команды, вкодированное в код операции, граница на основе регистра, заданная в команде, и т.д.); или граница может динамически определяться машиной. Например, команда определяет, что данные следует загрузить на границе страницы или кэша, и машина определяет размер строки кэша или страницы (напр., поиском в, к примеру, буфере динамической трансляции адресов для определения размера страницы), и загружает до этого места.

[0012] В последующем примере эта команда используется также для выравнивания обращений к данным по выбранной границе.

[0013] В одном из вариантов реализации команда загружает только байты векторного регистра (первый операнд) с соответствующими байтами второго операнда, которые находятся в пределах блока основной памяти, заданного командой. В данном контексте блок основной памяти (она же основное запоминающее устройство) является любым блоком памяти заданного размера. Заданный размер также называют границей блока, и граница является концом блока.

[0014] В последующем варианте реализации загружаются другие типы регистров. То есть, регистр, который загружается, является не векторным регистром, а регистром другого типа. В данном контексте командой называется команда Load to Block Boundary (загрузить до границы блока), которая используется для загрузки данных в регистр.

[0015] Один из вариантов осуществления вычислительной среды, включающей и использующей один или более аспектов данного изобретения, описаны при помощи ФИГ.1. Вычислительная среда 100 включает, например, процессор 102 (например, центральное процессорное устройство), память 104 (например, главная память) и одно или более устройств ввода-вывода (I/O) и/или интерфейсов 106, соединенных между собой посредством, например, одной или более шин 108 и/или других соединений.

[0016] В одном примере, процессор 102 основан на z/Architecture, предложенной корпорацией International Business Machines, и является частью сервера, такого как сервер System z, который также предложен корпорацией International Business Machines и реализовывает z/Architecture. Один из вариантов воплощения z/Architecture описан в публикации IBM®, озаглавленной "z/Architecture Principles of Operation" ("z/Architecture. Принципы работы"), публикация IBM® номер SA22-7832-08, девятое издание, август 2010 г., которая включается сюда по ссылке во всей ее целостности. В одном примере, процессор реализовывает операционную систему, такую как z/OS, также предложенную корпорацией International Business Machines. IBM®, Z/ARCHITECTURE® и Z/OS® являются зарегистрированными торговыми марками корпорации International Business Machines, Армонк, Нью Йорк, США. Другие названия, используемые в данном описании, могут быть зарегистрированными торговыми марками, торговыми марками, или названиями продуктов корпорации International Business Machines или других компаний.

[0017] В дополнительном варианте воплощения, процессор 102 основан на Power Architecture, предложенной корпорацией International Business Machines. Один вариант воплощения Power Architecture описан в "Power ISA™ Version 2.06 Revision В," корпорации International Business Machines, 23 июля 2010 г., который включается сюда по ссылке во всей его целостности. POWER ARCHITECTURE® является зарегистрированной торговой маркой корпорации International Business Machines.

[0018] В еще одном дополнительном варианте воплощения процессор 102 основан на архитектуре Intel, предложенной корпорацией Intel. Один вариант воплощения Intel архитектуры описан в "Intel® 64 and IA-32 Architectures Developer's Manual: Vol.2B, Instructions Set Reference, A-L" ("Архитектуры Intel® 64 и IA-32. Руководство разработчика: т.2B, справочник по набору команд, A-L"), порядковый номер 253666-041 US, декабрь 2011 г., и "Intel® 64 and IA-32 Architectures Developer's Manual: Vol.2B, Instructions Set Reference, M-Z" ("Архитектуры Intel® 64 и IA-32. Руководство разработчика: т.2B, справочник по набору команд, M-Z"), порядковый номер 253667-041 US, декабрь 2011 г., каждое из которых включается сюда по ссылке во всей его целостности. Intel® является зарегистрированной торговой маркой корпорации Intel, Санта-Клара, Калифорния.

[0019] Другой вариант воплощения вычислительной среды, включающей и использующей один или более аспектов данного изобретения, описан при помощи ФИГ.2А. В данном примере, вычислительная среда 200 включает, например, собственное центральное процессорное устройство 202, память 204, и одно или более устройств ввода-вывода и/или интерфейсов 206, соединенных между собой посредством, например, одной или более шин 208 и/или других соединений. Например, вычислительная среда 200 может включать процессор PowerPC, сервер pSeries или сервер xSeries, предложенные корпорацией International Business Machines, Армонк, Нью Йорк; HP Superdome с процессорами Intel Itanium II, предложенными Hewlett Packard Co., Пало-Альто, Калифорния; и/или другие машины, основанные на архитектуре, предложенной корпорацией International Business Machines, Hewlett Packard, Intel, Oracle, или другими.

[0020] Собственное центральное процессорное устройство 202 содержит один или более собственных регистров 210, такие как один или более регистров общего назначения и/или один или более регистров специального назначения, использующихся при обработке внутри среды. Эти регистры содержат сведения, которые представляют состояние среды в любой отдельный момент времени.

[0021] Кроме того, собственное центральное процессорное устройство 202 выполняет команды и код, хранящиеся в памяти 204. В отдельном примере центральное процессорное устройство выполняет код эмулятора 212, хранящийся в памяти 204. Этот код задействует вычислительную среду, настроенную на одной архитектуре для эмуляции другой архитектуры. Например, код эмулятора 212 позволяет машинам, основанным на архитектурах, отличных от z/Architecture, таких так процессоры PowerPC, серверы pSeries, серверы xSeries, серверы HP Superdome или другие, эмулировать z/Architecture и выполнять программное обеспечение и команды, разработанные на основе z/Architecture.

[0022] Дальнейшие подробности касательно кода эмулятора 212 описаны при помощи ФИГ.2Б. Гостевые команды 250 включают программные команды (напр., машинные команды), которые были разработаны для выполнения в архитектуре иной, нежели таковая собственного ЦПУ 202. Например, гостевые команды 250 могли быть разработаны для выполнения на процессоре 102 z/Architecture, но вместо этого эмулируются на собственном ЦПУ 202, которое может быть, например, процессором Intel Itanium II. В одном из примеров код эмулятора 212 включает модуль считывания команд 252 для получения одной или более гостевых команд 250 из памяти 204 и опционального обеспечения локальной буферизации полученных команд. Он включает также программу трансляции команд 254 для определения типа гостевой команды, которая была получена, и для трансляции гостевой команды в одну или более соответствующих собственных команд 256. Эта трансляция включает, например, идентификацию функции для выполнения гостевой командой и выбор собственной команды (команд), выполняющих эту функцию.

[0023] Далее, эмулятор 212 включает программу управления эмуляцией 260, заставляющую собственные команды выполняться. Программа управления эмуляцией 260 может заставить собственное ЦПУ 202 выполнить программу собственных команд, которые эмулируют одну или более ранее полученных гостевых команд, и, по завершению этого выполнения, вернуть управление программе считывания команд для эмуляции получения следующей гостевой команды или группы гостевых команд. Выполнение собственных команд 256 может включать загрузку данных в регистр из памяти 204; запись данных обратно в память из регистра; или выполнение некоторого типа арифметической или логической операции, как определено программой трансляции.

[0024] Каждая программа, например, реализована в программном обеспечении, которое хранится в памяти и выполняется собственным центральным процессорным устройством 202. В других примерах одна или более программ или операций могут быть реализованы в микропрограммном, аппаратном, программном обеспечении или в некоторой их комбинации. Регистры эмулируемого процессора могут эмулироваться с помощью регистров 210 собственного ЦПУ или с помощью ячеек в памяти 204. В вариантах реализации гостевые команды 250, собственные команды 256 и код эмулятора 212 могут находиться в одной памяти или могут быть рассредоточены по различным запоминающим устройствам.

[0025] В данном контексте, микропрограмма включает, напр., микрокод, милликод и/или макрокод процессора. Она включает, например, команды аппаратного уровня и/или структуры данных, используемые в реализации машинного кода высокого уровня. В одном варианте реализации она включает, например, проприетарный код, который обычно поставляется как микрокод, который включает достоверное программное обеспечение или микрокод, специфичный для нижележащего аппаратного обеспечения, и управляет доступом операционной системы к системному аппаратному обеспечению.

[0026] В одном примере гостевая команда 250, которая считывается, транслируется и выполняется, является командой, описываемой здесь. Команда одной архитектуры (напр., для z/Architecture) считывается из памяти, транслируется и представляется в виде последовательности собственных команд 256 другой архитектуры (напр., PowerPC, pSeries, xSeries, Intel и т.п.). Затем эти собственные команды выполняются.

[0027] В одном из вариантов команда, описанная здесь, является векторной командой, которая является частью векторного средства, предоставляемого в соответствии с аспектом данного изобретения. Векторное средство предоставляет, например, векторы постоянного размера в пределах от одного до шестнадцати элементов. Каждый вектор содержит данные, которые обрабатываются векторными командами, определенными этим средством. В одном из вариантов реализации, если вектор составлен из нескольких элементов, то каждый элемент обрабатывается параллельно с другими элементами. Завершения команды не происходит, пока не будет завершена обработка всех элементов.

[0028] Как описано здесь, векторные команды могут быть реализованы как часть различных архитектур, включая, но не ограничиваясь, z/Architecture, Power, Intel и т.д. Хотя здесь описывается реализация для z/Architecture, векторные команды и один или более аспектов данного изобретения могут основываться на многих других архитектурах. z/Architecture является только одним из примеров.

[0029] В одном варианте, в котором векторное средство реализовано как часть z/Architecture, для использования векторных регистров и команд, директива задействования вектора и директива регистра в заданном управляющем регистре (напр., управляющем регистре 0) установлены, например, в единицу. Если векторное средство установлено, и векторная команда выполняется без установленных директив задействования, обнаруживается исключение данных. Если векторное средство не установлено, и выполняется векторная команда, обнаруживается исключение операции.

[0030] Векторные данные появляются в памяти, например, в той же последовательности слева направо, что и данные других форматов. Биты формата данных, пронумерованные 0-7, составляют байт в самой левой (с наименьшим номером) байтовой ячейке памяти, биты 8-15 образуют байт в следующей последовательной ячейке и так далее. В другом примере векторные данные могут появляться в памяти в другой последовательности, такой как справа налево.

[0031] Многие из векторных команд, обеспеченных векторным средством, имеют поле заданных битов. Это поле называемое битом расширения регистра (register extension bit) или RXB, содержит самые старшие биты для каждого из заданных векторным регистров операндов. Биты для обозначений регистров, не заданных командой, должны быть зарезервированы и установлены в нуль.

[0032] В одном из примеров поле RXB включает четыре бита (например, биты 0-3), и биты определены следующим образом:

[0033] 0 - самый старший бит для обозначения первого векторного регистра в команде.

[0034] 1 - самый старший бит для обозначения второго векторного регистра в команде, если таковой имеется.

[0035] 2 - самый старший бит для обозначения третьего векторного регистра в команде, если таковой имеется.

[0036] 3 - самый старший бит для обозначения четвертого векторного регистра в команде, если таковой имеется.

[0037] Каждый бит устанавливается в нуль или единицу, например, ассемблером в зависимости от количества регистров. Например, для регистров 0-15 бит устанавливается в 0; для регистров 16-31 бит устанавливается в 1 и т.п.

[0038] В одном из вариантов реализации каждый бит RXB является битом расширения для отдельной ячейки в команде, которая включает один или более векторных регистров. Например, в одной или более векторных команд бит 0 поля RXB является битом расширения для ячейки 8-11, которая закреплена за, напр., V1; бит 1 поля RXB является битом расширения для ячейки 12-15, которая закреплена за, напр., V2; и так далее.

[0039] В другом варианте реализации поле RXB содержит дополнительные биты, и в качестве расширения для каждого вектора или ячейки используется более чем один бит.

[0040] Одна команда, обеспеченная в соответствии с аспектом настоящего изобретения, которая включает поле RXB, представляет собой команду Vector Load To Block Boundary, пример которой показан на ФИГ.3. В одном примере, команда Vector Load То Block Boundary 300 содержит поля кода операции 302а (например, биты 0-7), 302b (например, биты 40-47), обозначающие операцию Vector Load To Block Boundary; поле векторного регистра 304 (например, биты 8-11), использующееся для задания векторного регистра (V1); индексное поле (X2) 306 (например, биты 12-15); базовое поле (B2) 308 (например, биты 16-19); поле смещения (D2) 310 (например, биты 20-31); поле маски (M3) 312 (например, биты 32-35); и поле RXB 316 (например, биты 36-39). Каждое из полей 304-314 в одном примере отделено и независимо от поля (полей) кода операции. Далее, в одном варианте реализации они отделены и независимы друг от друга; однако в других вариантах более чем одно поле могут комбинироваться. Дальнейшие сведения об использовании этих полей описываются ниже.

[0041] В одном из примеров выбранные биты (напр., первые два бита) кода операции, заданные полем кода операции 302а определяют длину и формат команды. В этом частном примере длина равна трем полусловам, а формат является векторной регистрово-индексной операцией сохранения с расширенным полем кода операции. Векторное (V) поле, вместе с соответствующим ему битом расширения, заданным RXB, определяет векторный регистр. В частности, для векторных регистров, регистр, содержащий операнд, определяется при помощи, например, четырехбитного поля регистрового поля с прибавлением бита расширения регистра (RXB) в качестве самого старшего бита. Например, если четырехбитное поле равно 0110, а бит расширения равен 0, то пятибитное поле 00110 обозначает регистр номер 6.

[0042] Нижний индекс, связанный с полем команды, обозначает операнд, к которому применяется поле. Например, нижний индекс 1, связанный с V1, обозначает первый операнд и так далее. Регистровый операнд равен одному регистру по длине, которая составляет, например, 128 бит.

[0043] В одном примере, в команде операции векторного регистроиндексного сохранения, содержимое регистров общего назначения, определенное полями X1 и B2, прибавляется к содержимому поля D2 для получения адреса второго операнда. Смещение D2 для команды Vector Load To Block Boundary рассматривается как 12-битное целое без знака, в одном примере.

[0044] Поле M3 в одном из вариантов осуществления определяет код, который используется для сообщения ЦПУ о границе блока, до которой следует загрузиться. Если определено зарезервированное значение, обнаруживается исключение определения. Примерные коды и соответствующие значения следующие:

[0045]

Код Граница
0 64 байта
1 128 байт
2 256 байт
3 512 байта
4 1 кбайт
5 2 кбайта
6 4 кбайта

[0046] При выполнении одной из реализации команды Vector Load To Block Boundary (VLBB), происходящем в одном из вариантов слева направо, первый операнд (заданный в регистре, определенном полем V1 плюс бит расширения) загружается, начиная с элемента байта с нулевым индексом, байтами из второго операнда. Второй операнд является ячейкой памяти, определенной адресом второго операнда (также называемым начальным адресом). Загрузка начинается с этой ячейки памяти и продолжается до конечного адреса, вычисленного командой (или процессором) как описано ниже. Если встречается граничное условие, обработка остатка первого операнда зависит от модели. Исключения доступа не обнаруживаются на байтах, которые не загружены. В одном из примеров байты, которые не загружены, непредсказуемы.

[0047] В выше приведенном примере команды, начальный адрес определяется значением индексного регистра (X2) + значение базового регистра (B2) + смещение (D2); однако в других реализациях он предоставляется значением регистра; адресом команды + отступ, заданный в тексте команды; значением регистра + смещение; или значением регистра + значение индексного регистра; это лишь некоторые примеры. Далее, в одном варианте команда не содержит поля RXB. Вместо этого, расширение не используется, или расширение предоставляется другим способом, таким как директива извне команды, или предоставляется как часть другого поля команды.

[0048] Дальнейшие подробности воплощения обработки команды Vector Load to Block Boundary описаны при помощи ФИГ.4. В одном примере процессор вычислительной среды следует данной логике.

[0049] В одном из вариантов воплощения вначале создается маска границы (BdyMask), которая используется для определения близости к заданной границе, ШАГ 400. Чтобы создать маску, в одном примере берется двоичное дополнительное отрицание от размера границы (BdySize) 402, создающее маску границы 404 (напр., BdyMask=0-BdySize). Размер границы предоставляется, в одном примере, командой (напр., полем М3); а в другом примере он определяется машиной согласно данной заявке.

[0050] После этого вычисляется начальный адрес, который обозначает ячейку в памяти, из которой должна начинаться загрузка, ШАГ 410. К примеру, начальный адрес 412 может быть предоставлен значением регистра; адресом команды плюс отступ, заданный в тексте команды; значением регистра плюс смещение; значением регистра плюс значение индексного регистра; или значением регистра плюс значение индексного регистра плюс смещение. В предоставленной здесь команде начальный адрес предоставляется полем Х2, полем В2 и полем D2. То есть, содержимое регистров, заданных полями Х2 и В2, прибавляется к смещению, указанному D2 для получения начального адреса. Вышеуказанные способы вычисления начального адреса являются лишь примерами; другие примеры также возможны.

[0051] Далее, вычисляется конечный адрес, указывающий, откуда остановить загрузку, ШАГ 420. Вводными для этого вычисления являются, например, размер границы 402, начальный адрес 412, размер вектора 414 (напр., в байтах; напр., 16) и маска границы 404. В одном из примеров конечный адрес 422 вычисляется следующим образом:

[0052] EndAddress = min(StartAddress + (BdySize - (StartAddress & ¬BdyMask)), StartAddress + vec_size).

[0053] Затем первый операнд (т.е., заданный векторный регистр) загружается, начиная с байта с индексом 0, из памяти, начинаясь с начального адреса и заканчиваясь на конечном адресе, ШАГ 430. Это дает возможность загрузить переменное число байт из памяти в вектор без пересечения заданной границы памяти. Например, если граница памяти на 64 байтах, а начальный адрес на 58 байтах, то байты 58-64 загружаются в векторный регистр.

[0054] Один из примеров данных для загрузки в векторный регистр, в соответствии с аспектом данного изобретения, изображен на ФИГ. 5. Как отмечено, никакие данные не загружаются после границы, обозначенной пунктирной вертикальной линией. Ячейки после границы недоступны, и не делается никаких исключений. В одном частном варианте вектор загружается слева направо. Однако, в другом варианте он может загружаться справа налево. В одном варианте направление векторов, слева направо или справа налево, определяется динамически (при выполнении программы). Например, команда обращается к регистру, директиве состояния или другому параметру, который указывает направление обработки слева направо либо справа налево, к примеру. В одном из вариантов эта директива направления не вкодирована как часть команды, а предоставляется команде динамически (при выполнении).

[0055] Ниже описан один из примеров команды загрузки. При загрузке данных, таких как строчные данные, часто неизвестно, закончится ли строка перед границей страницы. Способность загрузиться до этой границы обычно требует первой проверки на конец строки. Некоторые реализации могут также иметь ограничения на пересечение границ, и программное обеспечение может пытаться избегать этого. Таким образом, способность загружаться до нескольких границ полезна. Предоставляется команда, которая загружает переменное количество байт в векторный регистр, в то же время, гарантируя, что данные из-за заданной границы не загружаются.

[0056] В одном из вариантов воплощения есть 32 векторных регистра, а другие типы регистров могут быть отображены на квадрант векторных регистров. К примеру, как изображено на ФИГ. 6, если есть файл регистра 600, который содержит 32 векторных регистра 602, и каждый регистр имеет 128 бит в длину, то 16 регистров с плавающей точкой 604, которые имеют 64 бит в длину, могут быть наложены на векторные регистры. Таким образом, к примеру, когда регистр с плавающей точкой 2 изменяется, то векторный регистр 2 также изменяется. Другие отображения для других типов регистров также возможны.

[0057] В данном контексте, термины "память", "главная память", "запоминающее устройство" и "главное запоминающее устройство" используются как взаимозаменяемые, если не указано иное, явным образом или неявно по контексту.

[0058] Дополнительные детали, касающиеся векторного средства, включая примеры команд, представлены ниже как часть этого Подробного описания.

[0059] Как оценят специалисты в данной области техники, один или больше аспектов настоящего изобретения могут быть воплощены в виде системы, способа или компьютерного программного продукта. Соответственно, один или больше аспектов настоящего изобретения могут принимать форму целиком аппаратного варианта осуществления, целиком программного варианта осуществления (содержащего аппаратно-программное обеспечение, резидентное программное обеспечение, микрокод и т.д.) или варианта осуществления, сочетающего программные и аппаратные особенности, которые все могут в целом именоваться в описании "схемой", "модулем" или "системой". Кроме того, один или больше аспектов настоящего изобретения могут принимать форму компьютерного программного продукта, воплощенного в одной или нескольких машиночитаемых средах, в которых записан машиночитаемый программный код.

[0060] Может использоваться любое сочетание одной или нескольких машиночитаемых сред. Машиночитаемой средой может являться машиночитаемая запоминающая среда (носитель данных). Машиночитаемой запоминающей средой может являться, например, без ограничения электронная, магнитная, оптическая, электромагнитная, инфракрасная или полупроводниковая система, аппаратура или устройство или любое применимое сочетание перечисленного. Более конкретные примеры (не исчерпывающий список) машиночитаемой запоминающей среды включают: электрическое соединение, содержащее один или несколько проводов, портативный компьютерный диск, жесткий диск, оперативное запоминающее устройство (ОЗУ), постоянное запоминающее устройство (ПЗУ), стираемое программируемое постоянное запоминающее устройство (СППЗУ или флэш-память), оптическое волокно, портативное постоянное запоминающее устройство на компакт-диске (CD-ROM), оптическое запоминающее устройство, магнитное запоминающее устройство или любое применимое сочетание перечисленного. В контексте настоящего документа машиночитаемой запоминающей средой может являться любая материальная среда, в которой содержится или хранится программа для использования системой, аппаратурой или устройством выполнения команд или применительно к ним.

[0061] Как показано на ФИГ.7, в одном из примеров компьютерный программный продукт 700 содержит, например, одну или несколько не временных машиночитаемых запоминающих сред 702 для хранения в них машиночитаемого программного кода или логики 704 для обеспечения и реализации одного или нескольких аспектов настоящего изобретения.

[0062] Программный код, воплощенный в машиночитаемой среде, может передаваться с использованием соответствующей среды, включая без ограничения беспроводную, проводную среду, оптоволоконный кабель, ВЧ-среду и т.д. или любое применимое сочетание перечисленного.

[0063] Компьютерный программный код для выполнения операций, для одного или более аспектов настоящего изобретения, может быть записан на одном или нескольких языках программирования в любом сочетании, включая объектно-ориентированный язык программирования, такой как Java, Smalltalk, C++ и т.п., и традиционных процедурных языках программирования, таких как "C" и языки ассемблера или аналогичные языки программирования. Программный код может целиком выполняться в пользовательском компьютере, частично в пользовательском компьютере, в качестве автономного пакета программного обеспечения, частично в пользовательском компьютере и частично в удаленном компьютере или целиком в удаленном компьютере или сервере. В случае последнего сценария удаленный компьютер может быть соединен с пользовательским компьютером посредством сети любого типа, включая локальную вычислительную сеть (ЛВС) или глобальную вычислительную сеть (ГВС), или может быть установлено соединение с внешним компьютером (например, по сети Интернет с использованием поставщика услуг Интернет).

[0064] Один или более аспектов настоящего изобретения описаны со ссылкой на структурные схемы и/или блок-схемы способов, оборудования (систем) и компьютерных программных продуктов в соответствии с воплощениями настоящего изобретения. Подразумевается, что каждый блок на структурных схемах и/или блок-схемах и сочетания блоков на структурных схемах и/или блок-схемах могут быть реализованы посредством команд управления компьютерной программой. Эти команды управления компьютерной программой могут передаваться процессору универсального компьютера, специализированного компьютера или другой программируемого аппаратуры для обработки данных с целью формирования механизма, в котором команды, выполняемые посредством процессора компьютера или другого программируемого оборудования обработки данных, создают средство реализации функций/действий, обозначенных блоком или блоками на структурных схемах и/или блок-схемах.

[0065] Эти команды управления компьютерной программой также могут храниться в машиночитаемой среде, которая способна предписывать компьютеру, другому программируемому оборудованию обработки данных или другим устройствам действовать конкретным способом, в результате чего команды, хранящиеся в машиночитаемой среде, формируют продукт, содержащий команды, в которых реализуется функция/действие, обозначенное блоком или блоками на структурных схемах и/или блок-схемах.

[0066] Команды управления компьютерной программой также могут загружаться в компьютер, другое программируемое оборудование обработки данных или другие устройства, чтобы инициировать выполнение последовательности оперативных шагов компьютером, другим программируемым оборудованием или другими устройствами с целью формирования реализованного в компьютере процесса, при этом команды, выполняемые компьютером или другим программируемым оборудованием, обеспечивают процессы реализации функций/действий, обозначенных блоком или блоками на структурных схемах и/или блок-схемах.

[0067] Приведенные на чертежах структурные схемы и блок-схемы иллюстрируют архитектуру, функциональные возможности и действие возможных вариантов реализации систем, способов и компьютерных программных продуктов согласно различным вариантам осуществления одного или более аспектов настоящего изобретения. В связи с этим каждым блоком на структурных схемах или блок-схемах может быть представлен определенный модуль, сегмент или часть кода, которая содержит одну или несколько выполняемых команд для реализации заданной логической функции(-й). Следует также отметить, что в некоторых альтернативных вариантах реализации указанные в блоке функции могут выполняться не в том порядке, в котором они представлены на чертежах. Например, функции, указанные двумя последовательно показанными блоками, в действительности, могут выполняться преимущественно одновременно, или функции иногда могут выполняться в обратном порядке в зависимости от соответствующих функциональных возможностей. Следует также отметить, что каждый блок на блок-схемах и/или структурных схемах и сочетания блоков на блок-схемах и/или структурных схемах могут быть реализованы посредством специализированных аппаратных систем, выполняющих заданные функции или действия, или посредством сочетаний специализированных аппаратных систем и компьютерных команд.

[0068] Помимо вышесказанного, одна или несколько особенностей настоящего изобретения может обеспечиваться, предлагаться, применяться, координироваться, обслуживаться и т.д. поставщиком услуг, который предлагает управление пользовательскими средами. Например, поставщик услуг способен создавать, вести, поддерживать и т.д. для одного или нескольких пользователей машинный код и/или вычислительную инфраструктуру, в которой выполняется одна или несколько особенностей настоящего изобретения. В ответ поставщик услуг может получать оплату от пользователя на основании соглашения о подписке и/или абонентской плате в качестве примеров. Дополнительно или в качестве альтернативы, поставщик услуг может получать плату за рекламное содержание, продаваемое одному или нескольким третьим лицам.

[0069] Согласно одному аспекту настоящего изобретения для выполнения одного или нескольких аспектов настоящего изобретения может быть развернуто приложение. В качестве одного из примеров, развертывание приложения включает использование вычислительной инфраструктуры, способной выполнять один или несколько аспектов настоящего изобретения.

[0070] В качестве одного из дополнительных аспектов настоящего изобретения, развертывание вычислительной инфраструктуры может включать интегрирование машиночитаемого кода в вычислительную систему, при этом код в сочетании с вычислительной системой способен выполнять один или несколько аспектов настоящего изобретения.

[0071] В качестве еще одного из дополнительных аспектов настоящего изобретения может быть предложен способ интегрирования вычислительной инфраструктуры, включающий интегрирование машиночитаемого кода в компьютерную систему. Компьютерная система содержит машиночитаемую среду, содержащую один или несколько аспектов настоящего изобретения. Код в сочетании с компьютерной системой способен выполнять один или несколько аспектов настоящего изобретения.

[0072] Хотя различные варианты осуществления описаны выше, они являются лишь примерами. Например, вычислительные среды других архитектур могут содержать или использовать один или несколько аспектов настоящего изобретения. Далее, могут быть использованы регистры других размеров, и изменения в командах могут быть сделаны не отступая от сути настоящего изобретения.

[0073] Кроме того, другие типы вычислительных сред могут выгодно применяться из одного или нескольких аспектов настоящего изобретения. В качестве примера, может использоваться система обработки данных, применимая для хранения и/или выполнения программного кода и содержащая по меньшей мере два процессора, прямо или косвенно связанных со средствами памяти посредством системной шины. Элементы памяти включают, например, локальную память, применяемую во время фактического выполнения программного кода, массовую память и кэш-память, которая обеспечивает временное хранение по меньшей мере части программного кода для уменьшения необходимого числа случаев извлечения кода из массовой памяти во время выполнения.

[0074] С системой прямой или косвенно посредством промежуточных контроллеров ввода-вывода могут быть связаны устройства ввода-вывода (включая без ограничения, клавиатуры, дисплеи, координатно-указательные устройства, ЗУПД, накопители на магнитной ленте, на компакт-дисках, на многоцелевых компакт-дисках, портативные миниатюрные накопители на жестких дисках и другие запоминающие среды и т.д.). С системой также могут быть связаны сетевые адаптеры, позволяющие системе обработки данных устанавливать связь с другими системами обработки данных или удаленными принтерами или запоминающими устройствами посредством промежуточной частных или общедоступных сетей. Модемы, кабельные модемы и сетевые карты Ethernet являются лишь несколькими из сетевых адаптеров доступных типов.

[0075] Согласно ФИГ.8, на которой представлены характерные компоненты хост-компьютерной системы 5000 для реализации одного или нескольких аспектов настоящего изобретения. Характерный хост-компьютер 5000 содержит один или несколько процессоров 5001, поддерживающих связь с памятью (т.е. центральной памятью) 5002 компьютера, а также интерфейсы ввода-вывода с запоминающими средами 5011 и сетями 5010 для связи с другими компьютерами или SAN и т.п. Процессор 5001 совместим с архитектурой, содержащей структурированный набор команд и структурированные функциональные возможности. Процессор 5001 может иметь динамическую трансляцию адреса (DAT) 5003 для превращения адресов программ (виртуальных адресов) в действительные адреса памяти. DAT обычно содержит буфер 5007 быстрой трансляции адреса (TLB) для кэширования трансляций, чтобы при последующих доступах к блоку памяти 5002 компьютера не требовалась задержка трансляции адреса. Обычно между памятью 5002 компьютера и процессором 5001 используется кэш-память 5009. Кэш-память 5009 может являться иерархической и состоящей из кэша большой емкости, доступного для нескольких процессоров, и более быстродействующих кэшей (низкого уровня) меньшей емкости между кэшем большой емкости и каждым процессором. В некоторых случаях реализации кэши низкого уровня разделены на отдельные кэши низкого уровня для выборки команд и доступа к данным. В одном из вариантов осуществления блок 5004 выборки команд вызывает из памяти 5002 команду посредством кэш-памяти 5009. Команда декодируется в блоке 5006 декодирования команд и отправляется (с другими командами в некоторых вариантах осуществления) в блок или блоки 5008 выполнения команд. Обычно используется несколько блоков 5008 выполнения команд, например, блок выполнения арифметических команд, блок выполнения команд с плавающей точкой и блок выполнения команд ветвления. Команда выполняется блоком, который в зависимости от необходимости осуществляет доступ к операндам из определяемых командами регистров или памяти. Если доступ (загрузка или сохранение) к операнду должен осуществляться из памяти 5002, блок 5005 загрузки/сохранения обычно обрабатывает процедуру доступа под управлением выполняемой команды. Команды могут выполняться в аппаратных схемах или во внутреннем микрокоде (аппаратно-программном обеспечении) или с использованием сочетания того и другого.

[0076] Как было отмечено, в локальном (или основном) запоминающем устройстве компьютерной системы хранится информация, а также адресные, защитные, контрольные и корректирующие записи. Некоторые аспекты адресации включают формат адресов, концепцию адресных пространств, различные типы адресов и то, каким образом адрес одного типа транслируется в адрес другого типа. Некоторые из основных запоминающих устройств имеют постоянно абонированные ячейки. Основное запоминающее устройство обеспечивает систему запоминающим устройством с прямой адресацией и быстрой выборкой данных. В основное запоминающее устройство должны загружаться (из устройств ввода) как данные, так и программы, после чего они могут обрабатываться.

[0077] Основное запоминающее устройство может содержать одно или несколько буферных запоминающих устройств меньшей емкости с более быстрой выборкой, иногда называемых кэшами. Кэш обычно физически связан с процессором (ЦП) или процессором ввода-вывода. Физическая конструкция и использование различных запоминающих сред в целом не сказывается на программе за исключением производительности.

[0078] Для команд и операндов, хранимых в памяти, могу быть предусмотрены раздельные кэши. Информация содержится в кэше в форме непрерывных байтов на целочисленной границе, называемой блоком или строкой данных кэша (или для краткости строкой). Согласно одной из моделей может быть предусмотрена команда извлечения атрибута кэша (EXTRACT CACHE ATTRIBUTE), которая выдает размер строки кэша в байтах. Согласно одной из моделей также может быть предусмотрена команда упреждающей выборки данных (PREFETCH DATA) и команда упреждающей выборки данных относительно большой длины (PREFETCH DATA RELATIVE LONG) для упреждающей выборки данных из запоминающего устройства в кэш данных или команд или для высвобождения данных из кэша.

[0079] Запоминающее устройство рассматривается как длинная горизонтальная битовая строка. В случае большинства операций доступ к запоминающему устройству последовательно осуществляется слева направо. Битовая строка подразделяется на блоки из восьми разрядов. Восьмиразрядный блок называется байтом и является базовым конструктивным блоком всех форматов представления информации. Местоположение каждого байта в запоминающем устройстве идентифицируется однозначно определяемым неотрицательным целым числом, которое является адресом местоположения этого байта или просто адресом байта. Соседние местоположения байтов имеют идущие подряд адреса, начинающиеся слева с 0 и последовательно следующие слева направо. Адреса представляют собой двоичные целые числа без знака, содержащие 24, 31 или 64 разряда.

[0080] Обмен информацией между запоминающим устройством и процессором или канальной подсистемой осуществляется путем передачи одного байта или группы байтов за один раз. Если не оговорено иное, например, в системе z/Architecture хранящаяся группа байтов адресуется посредством крайнего левого байта из группы. Число байтов в группе подразумевается или прямо оговаривается выполняемой операцией. Используемая в работе процессора группа байтов называется полем. Разряды в каждой группе байтов, например, в системе z/Architecture последовательно нумеруются слева направо. Крайние левые разряды в z/Architecture иногда именуются "старшими" разрядами, а крайние правые разряды - "младшими" разрядами. Тем не менее, номера разрядов не являются адресами ячеек запоминающего устройства. Возможна только адресация байтов. Чтобы оперировать с отдельными разрядами хранящегося байта, осуществляется доступ ко всему байту. Разряды в байте пронумерованы слева направо от 0 до 7 (например, в системе z/Architecture). Разряды в адресе могут быть пронумерованы от 8 до 31 или от 40 до 63 в случае 24-разрядных адресов или от 1 до 31 или от 33 до 63 в случае 31-разрядных адресов и от 0 до 63 в случае 64-разрядных адресов. В любом другом имеющем фиксированную длину формате из множества байтов разряды, образующие формат, последовательно пронумерованы, начиная с 0. В целях обнаружения ошибок и предпочтительно их исправления с каждым байтом или группой байтов может передаваться один или несколько контрольных разрядов. Такие контрольные разряды генерируются автоматически машиной и не могут непосредственно управляться программой. Емкость запоминающего устройства выражается в числе байтов. Когда кодом операций команды подразумевается длина хранящегося поля операнда, считается, что поле имеет фиксированную длину, которая может составлять 1, 2, 4, 8 или 16 байтов. Для некоторых команд могут подразумеваться более длинные поля. Когда длина хранящегося поля операнда не подразумевается, а прямо указывается, считается, что поле имеет переменную длину. Операнды переменной длины могут различаться по длине с шагом в 1 байт (или в случае некоторых команд с шагом в 2 байта и другими шагами). При сохранении информации в запоминающем устройстве замещается содержимое местоположений только тех байтов, которые включены в указанное поле, несмотря на то, что ширина физического пути доступа к запоминающему устройству может превышать длину сохраняемого поля.

[0081] Некоторые хранящиеся единицы информации должны находиться на целочисленной границе. Применительно к единице информации граница называется целочисленной, когда адрес ее ячейки запоминающего устройства кратен длине единицы информации в байтах. Полям длиной 2, 4, 8 и 16 байтам на целочисленной границе даются особые названия. Полуслово является группой из 2 идущих подряд байтов на двухбайтовой границе и представляет собой базовый конструктивный блок команд. Слово является группой из 4 идущих подряд байтов на четырехбайтовой границе. Двойное слово является группой из 8 идущих подряд байтов на 8-байтовой границе. Учетверенное слово является группой из 16 идущих подряд байтов на 16-байтовой границе. Когда в адресах ячеек запоминающего устройства указаны полуслова, слова, двойные слова и учетверенные слова, в двоичном представлении адреса содержится один, два, три или четыре крайних правых нулевых разряда, соответственно. Команды должны находиться на двухбайтовых целочисленных границах. Хранящиеся операнды большинства команд не содержат требования размещения на границах.

[0082] В устройствах, в которых реализованы раздельные кэши для команд и операндов, могут происходить значительные задержки, если программа сохраняется в строке кэша, из которой впоследствии осуществляется выборка команд, независимо от того, изменяются ли при сохранении команды, выборка которых впоследствии осуществляется.

[0083] В одном варианте осуществления, настоящее изобретение может быть реализовано на практике посредством программного обеспечения (иногда называемого лицензионным внутренним кодом, аппаратно-программным обеспечением, микрокодом, милликодом, пикокодом и т.п., что во всех случаях согласуется с одним или большим количеством аспектов настоящего изобретения). Как показано на ФИГ.8, обычно процессор 5001 хост-системы 5000, получает доступ к программному коду системы программного обеспечения, в котором воплощены один или больше аспектов настоящего изобретения, посредством долговременных запоминающих сред 5011, таких как ПЗУ на компакт-дисках, накопитель на магнитной ленте или накопитель на жестких дисках. Программный код системы программного обеспечения может быть воплощен в любой из разнообразных известных сред для применения с системой обработки данных, такой как дискета, накопитель на жестких дисках или ПЗУ на компакт-дисках. Код может распределяться в таких средах или может распределяться пользователям из памяти 5002 компьютера или запоминающего устройства одной компьютерной системы по сети 5010 другим компьютерным системам для применения пользователями таких других систем.

[0084] Программный код включает операционную систему, которая управляет функцией и взаимодействием различных узлов вычислительной машины и одной или нескольких прикладных программ. Обычно подкачка страниц программного кода осуществляется из запоминающей среды 5011 в относительно быстродействующее запоминающее устройство 5002, в котором он доступен для обработки процессором 5001. Методы и способы воплощения программного кода системы программного обеспечения в памяти, в физических средах и/или распределения программного кода посредством сетей хорошо известны и не будут дополнительно рассматриваться в описании. Программный код, созданный и хранящийся в материальной среде (включая без ограничения модули электронной памяти (ОЗУ), флэш-память, компакт-диски, универсальные цифровые диски, магнитную ленту и т.п.) часто именуется "компьютерным программным продуктом". Содержащая компьютерный программный продукт среда обычно может считываться устройством обработки данных предпочтительно в компьютерной системе для выполнения устройством обработки данных.

[0085] На ФИГ.9 проиллюстрирована характерная рабочая станция или аппаратная серверная система, в которой может быть на практике реализованы один или большее количество аспектов настоящего изобретения. В показанную на ФИГ.9 систему 5020 входит характерная базовая компьютерная система 5021, такая как персональный компьютер, рабочая станция или сервер, включая необязательные периферийные устройства. Базовая компьютерная система 5021 имеет один или несколько процессоров 5026 и шину для соединения процессора(ов) 5026 и других компонентов системы 5021 и обеспечения связи между ними известными способами. Шина соединяет процессор 5026 с памятью 5025 и долговременным запоминающим устройством 5027, которое может содержать накопитель на жестких дисках (например, включая любое из следующего: магнитный носитель, компакт-диск, универсальный цифровой диск и флэш-память) или, например, накопитель на магнитной ленте. В систему 5021 также может входить адаптер пользовательского интерфейса, который посредством шины соединяет микропроцессор 5026 с одним или несколькими устройствами сопряжения, такими как клавиатура 5024, мышь 5023, принтер/сканнер 5030 и/или другие устройства сопряжения, которыми могут являться любое пользовательское устройство сопряжения, такое как сенсорный экран, дополнительная цифровая клавиатура и т.д. Шина посредством дисплейного адаптера также соединяет дисплей 5022, такой как ЖК-дисплей или монитор с микропроцессором 5026.

[0086] Система 5021 может поддерживать связь с другими компьютерами или компьютерными сетями посредством сетевого адаптера, способного поддерживать связь 5028 с сетью 5029. Примерами сетевых адаптеров являются каналы связи, кольцевая сеть с эстафетным доступом, сеть Ethernet или модемы. В качестве альтернативы, система 5021 может поддерживать связь с использованием беспроводного интерфейса, такого как карта CDPD (сотовой системы передачи пакетов цифровых данных). Система 5021 может быть связана с другими такими компьютерами в локальной вычислительной сети (ЛВС) или глобальной вычислительной сети (ГВС), или системой 5021 может являться клиент, связанный отношениями клиент/сервер с другим компьютером и т.д. Все эти конфигурации, а также соответствующее коммуникационное оборудование и программное обеспечение известны из уровня техники.

[0087] На ФИГ.10 проиллюстрирована сеть 5040 обработки данных, в которой может быть реализовано на практике один или несколько аспектов настоящего изобретения. В сеть 5040 обработки данных может входить множество отдельных сетей, таких как беспроводная сеть и проводная сеть, в каждую из которых может входить множество отдельных рабочих станций 5041, 5042, 5043, 5044. Кроме того, как известно специалистам в данной области техники, в нее может входить одна или несколько ЛВС, в которую может входить множество интеллектуальных рабочих станций, связанных с хост-процессором.

[0088] На ФИГ.10 также показано, что в сети также могут входить мэйнфреймы или серверы, такие как шлюз (клиент-сервер 5046) или сервер приложений (удаленный сервер 5048, который может осуществлять доступ к хранилищу данных, а также может быть доступен непосредственно с рабочей станции 5045). Шлюз 5046 служит точкой входа в каждую отдельную сеть. Шлюз необходим при подсоединении одного сетевого протокола к другому. Шлюз 5046 предпочтительно может быть связан с другой сетью (например, сетью Интернет 5047) линией связи. Шлюз 5046 также может быть непосредственно связан с одной или несколькими рабочими станциями 5041, 5042, 5043, 5044 с использованием линии связи. Шлюз может быть реализован с использованием сервера IBM eServer™ System z производства International Business Machines Corporation.

[0089] Как показано на ФИГ.9 и 10, доступ к программному коду системы программного обеспечения, в котором может быть воплощен один или несколько аспектов настоящего изобретения, может осуществлять процессор 5026 системы 5020 посредством долговременных запоминающих сред 5027, таких как ПЗУ на компакт-дисках, или накопитель на жестких дисках. Программный код системы программного обеспечения может быть воплощен в любой из разнообразных известных сред для применения с системой обработки данных, такой как дискета, накопитель на жестких дисках или ПЗУ на компакт-дисках. Код может распределяться в таких средах или может распределяться пользователям 5050, 5051 из памяти компьютера или запоминающего устройства одной компьютерной системы по сети другим компьютерным системам для применения пользователями таких других систем.

[0090] В качестве альтернативы, программный код может быть воплощен в памяти 5025 с возможностью доступа к нему для процессора 5026 с использованием процессорной шины. В таком программном коде реализована операционная система, которая управляет функцией и взаимодействием различных узлов вычислительной машины и одной или нескольких прикладных программ 5032. Обычно подкачка страниц программного кода осуществляется из запоминающих сред 5027 в быстродействующее запоминающее устройство 5025, в котором он доступен для обработки процессором 5026. Методы и способы воплощения программного кода системы программного обеспечения в памяти, в физических средах и/или распределения программного кода посредством сетей хорошо известны и не будут дополнительно рассматриваться в описании. Программный код, созданный и хранящийся в материальной среде (включая без ограничения модули электронной памяти (ОЗУ), флэш-память, компакт-диски, универсальные цифровые диски, магнитную ленту и т.п.) часто именуется "компьютерным программным продуктом". Содержащая компьютерный программный продукт среда обычно может считываться устройством обработки данных предпочтительно в компьютерной системе для выполнения устройством обработки данных.

[0091] Кэш, который является наиболее легко доступным для процессора (обычно более быстродействующим и менее объемным, чем другие кэши процессора), представляет собой кэш низшего уровня (L1 или уровня 1), а основное запоминающее устройство (основная память) представляет собой кэш высшего уровня (L3 в случае 3 уровней). Кэш низшего уровня часто поделен на кэш команд (I-кэш), в котором хранятся машинные команды для выполнения, и кэш данных (D-кэш), в котором хранятся операнды, хранимые в памяти.

[0092] На ФИГ.11 проиллюстрирован один из примеров осуществления процессора 5026. Обычно с целью помещения в буфер блоков памяти и повышения производительности процессора используется один или несколько уровней кэша 5053. Кэш 5053 представляет собой высокоскоростной буфер, в котором в строках данных кэша хранятся данные в памяти, которые вероятно будут использоваться. Типичные строки данных кэша содержат 64, 128 или 256 байтов данных в памяти. Для кэширования команд и для кэширования данных часто используются раздельные кэши. Согласованность кэшей (синхронизация копий строк в памяти и в кэшах) часто обеспечивается различными алгоритмами слежения ("snoop"), хорошо известными из уровня техники. Основное запоминающее устройство 5025 процессорной системы часто называют кэшем. В процессорной системе, имеющей уровня 4 кэша 5053, основное запоминающее устройство 5025 иногда называют кэшем уровня 5 (L5), поскольку оно обычно является более быстродействующими и представляет собой лишь часть энергонезависимого запоминающего устройство (ЗУПД, ЗУ на ленте и т.д.), которое доступно для компьютерной системы. Основное запоминающее устройство 5025 "кэширует" страницы данных, которые подкачиваются в основное запоминающее устройство 5025 и откачиваются из него операционной системой.

[0093] Программный счетчик (счетчик команд) 5061 отслеживает адрес текущей команды для выполнения. Счетчиком команд в процессоре на основе z/Architecture является 64-разрядным, при этом он может быть усечен до 31 или 24 разрядов с целью поддержки ранее существовавших ограничений адресации. Поскольку счетчик команд обычно воплощен в слове состояния программы (PSW) компьютера, оно сохраняется при переключении контекста. Соответственно, выполняемая программа с показанием счетчика команд может прерываться, например, операционной системой (при переключении контекста из программной среды в среду операционной системы). PSW программы поддерживает показание счетчика команд, пока программа неактивна, а во время выполнения операционной системы используется счетчик команд (в PSW) операционной системы. Обычно показание счетчика команд приращивается на величину, равную числу байтов текущей команды. RISC-команды (на основе вычислений с сокращенным набором команд) обычно имеют фиксированную длину, тогда как CISC-команды (на основе вычислений с полным набором команд) обычно имеют переменную длину. Команды, используемые в системе IBM z/Architecture, являются CISC-командами, имеющими длину 2, 4 или 6 байтов. Показание счетчика 5061 команд изменяется, например, в результате операции переключения контекста или операции выбранного ветвления согласно команде ветвления. При операции переключения контекста в слове состояния программы сохраняется текущее показание счетчика команд вместе с другой информацией о состоянии выполняемой программы (такой как коды условий), и загружается новое показание счетчика команд, указывающее на команду нового программного модуля для выполнения. Операция выбранного ветвления выполняется, чтобы позволить программе принимать решения, или чтобы выполнять программный цикл путем загрузки в счетчик 5061 команд результата команды ветвления.

[0094] Обычно для выборки команд от имени процессора 5026 применяется блок 5055 выборки команд. Блок выборки осуществляет выборку "очередных последовательных команд", целевых команд из команд выбранного ветвления или первых команд программы, следующей за переключением контекста. В современных блоках выборки команд часто применяют методы выборки с целью предварительной выборки команд по предположению, исходя из вероятности использования команд, предварительная выборка которых была осуществлена. Например, блок выборки может осуществлять выборку 16 байтов команды, содержащих очередную последовательную команду, и дополнительных байтов следующих далее команд.

[0095] Затем вызванные команды выполняются процессором 5026. В одном из вариантов осуществления вызванная команда(-ы) передаются блоку 5056 диспетчеризации блока выборки. Блок диспетчеризации декодирует команду(-ы) и пересылает информацию о декодированной команде(-ах) соответствующим блокам 5057, 5058, 5060. Блок 5057 выполнения обычно принимает информацию о декодированных арифметических командах от блока 5055 выборки команд и выполняет арифметические операции с операндами в соответствии с содержащимся в команде кодом операции. Операнды предоставляются блоку 5057 выполнения предпочтительно из памяти 5025, структурированных регистров 5059 или из непосредственного поля выполняемой команды. Сохраненные результаты выполнения хранятся в памяти 5025, регистрах 5059 или в другом машинном аппаратном обеспечении (таком как управляющие регистры, регистры PSW и т.п.).

[0096] Процессор 5026, как правило, имеет один или несколько блоков 5057, 5058, 5060, выполнения функции команды. Как показано на ФИГ.12А, блок 5057 выполнения, посредством интерфейсной логической схемы 5071, может поддерживать связь со структурированными общими регистрами 5059, блоком 5056 декодирования/диспетчеризации, блоком 5060 загрузки/сохранения и другими процессорными блоками 5065. В блоке 5057 выполнения может применяться несколько регистровых схем 5067, 5068, 5069 для хранения информации, с которой будет работать арифметическое логическое устройство (ALU) 5066. ALU выполняет арифметические операции, такие как сложение, вычитание, умножение и деление, а также логические функции, такие как И, ИЛИ и исключающее ИЛИ, поворот и смещение. ALU предпочтительно поддерживает зависящие от конструкции специализированные операции. В других схемах могут обеспечиваться другие структурированные средства 5072, включающие, например, коды условия и логическую схему поддержки восстановления. Обычно результат операции ALU хранится в схеме 5070 выходного регистра, из которой он может пересылаться целому ряду других функций обработки. Хотя существует множество конструкций процессоров, настоящее описание имеет целью лишь обеспечить понимание одного из вариантов осуществления.

[0097] Например, команда сложения (ADD) выполняется блоком 5057 выполнения, обладающим арифметическими и логическими функциональными возможностями, а, например, команда с плавающей точкой выполняется блоком вычислений с плавающей точкой, обладающим специализированными возможностями работы с плавающей точкой. Блок выполнения предпочтительно работает с указанными командой операндами путем выполнения заданной кодом операции функции применительно к операндам. Например, команда сложения может выполняться блоком 5057 выполнения применительно к операндам, обнаруженным в двух регистрах 5059, указанных в регистровых полях команды.

[0098] Блок 5057 выполнения выполняет арифметическое сложение двух операндов и сохраняет результат в третьем операнде, которым может являться третий регистр или один из двух исходных регистров. Блок выполнения предпочтительно использует арифметическое логическое устройство (ALU) 5066, способное выполнять ряд логических функций, таких как смещение, поворот, И, ИЛИ и исключающее ИЛИ, а также ряд алгебраических функций, включая любые из следующих функций: сложение, вычитание, умножение, деление. Некоторые ALU 5066 рассчитаны на скалярные операции, а некоторые - на операции с плавающей точкой. В зависимости от архитектуры данные могут иметь обратный порядок следования байтов (когда наименьший значимый байт соответствует старшему байтовому адресу) или прямой порядок следования байтов (когда наименьший значимый байт соответствует младшему байтовому адресу). В системе IBM z/Architecture используется обратный порядок следования байтов. В зависимости от архитектуры поля чисел со знаком могут быть представлены в виде прямого кода, дополнения до единицы или дополнения до двух. Число в форме дополнения до двух выгодно в том смысле, что ALU не требуется поддерживать возможность вычитания, поскольку при отрицательной или положительной величине дополнения до двух в ALU требуется только сложение. Числа обычно описаны в сокращенном виде, в котором 12-разрядное поле определяет адрес блока из 4096 байтов и обычно описано, например, в виде 4-х килобайтового блока.

[0099] Как показано на ФИГ.12Б, информация, содержащаяся в команде ветвления, для выполнения команды ветвления обычно передается блоку 5058 ветвления, в котором часто применяется алгоритм предсказания ветвления, такой как таблица 5082 предыстории ветвления, для предсказания исхода ветвления до завершения других условных операций. Целевой объект текущей команды ветвления вызывается и выполняется по предположению до завершения условных операций. Когда условные операции завершены, выполненные по предположению команды ветвления завершаются или отбрасываются, исходя из условной операции и предположенного исхода. Типичная команда ветвления может предусматривать проверку кодов условий и ветвление к целевому адресу, если коды условий отвечают требованию команды ветвления, при этом целевой адрес может вычисляться на основании нескольких чисел, включая, например, числа из регистровых полей или непосредственного поля команды. В блоке 5058 ветвления может применяться ALU 5074, имеющее множество схем 5075, 5076, 5077 входных регистров и схему 5080 выходного регистра. Блок 5058 ветвления, например, может поддерживать связь с общими регистрами 5059, декодировать блок 5056 диспетчеризации или другие схемы 5073.

[00100] Выполнение группы команд может прерываться по ряду причин, включая, например, переключение контекста, инициированное операционной системой, исключительную ситуацию или ошибку в процессе выполнения программы, приводящую к переключению контекста, сигнал прерывания ввода-вывода, приводящий к переключению контекста, или многопоточный режим работы множества программ (в многопоточной среде). Переключение контекста предпочтительно служит для сохранения информации о состоянии выполняемой в данный момент программы и затем для загрузки информации о состоянии другой вызываемой программы. Информация о состоянии может сохраняться, например, в аппаратных регистрах или в памяти. Информация о состоянии предпочтительно содержит показание счетчика команд, указывающее очередную команду для выполнения, коды условий, сведения о транслировании данных памяти и содержимое структурированного регистра. Переключение контекста может осуществляться аппаратными схемами, прикладными программами, программами операционной системы или аппаратно-программным кодом (микрокодом, пикокодом или лицензионным внутренним кодом (LIC) по отдельности или в сочетании).

[00101] Процессор осуществляет доступ к операндам в соответствии с определенными командами способами. Команда может содержать непосредственный операнд, в котором используется значение части команды, может содержать одно или несколько регистровых полей, прямо указывающих регистры общего назначения или регистры особо назначения (например, регистры с плавающей точкой). В команде могут использоваться подразумеваемые регистры, обозначаемые полем кода операции как операнды. В команде могут использоваться ячейки памяти для операндов. Ячейка памяти для операнда может обеспечиваться регистром, непосредственным полем или сочетанием регистров и непосредственного поля, примером чего является средство дальнего смещения на основе системы z/Architecture, в котором команда определяет базовый регистр, индексный регистр и непосредственное поле (поле смещения), которые суммируются с целью получения, например, адреса операнда в памяти. Под ячейкой в данном случае подразумевается ячейка основной памяти (основного запоминающего устройства), если не указано иное.

[00102] Как показано на ФИГ.12В, процессор осуществляет доступ к памяти с использованием блока 5060 загрузки/сохранения. Блок 5060 загрузки/сохранения может выполнять операцию загрузки путем получения адреса целевого операнда в памяти 5053 и загрузки операнда в регистр 5059 или другую ячейку памяти 5053, или может выполнять операцию сохранения путем получения адреса целевого операнда в памяти 5053 и сохранения данных, полученных из регистра 5059 или другой ячейки памяти 5053, в ячейке целевого операнда в памяти 5053. Блок 5060 загрузки/сохранения может действовать по предположению и осуществлять доступ к памяти в последовательности, которая не соответствует последовательности команд, тем не менее, блок 5060 загрузки/сохранения должен обеспечивать для программ видимость выполнения команды по порядку. Блок 5060 загрузки/сохранения может поддерживать связь с общими регистрами 5059, блоком 5056 декодирования/диспетчеризации, интерфейсом 5053 кэша/памяти или другими элементами 5083 и содержит различные регистровые схемы, ALU 5085 и управляющую логику 5090 для вычисления адресов ячеек запоминающего устройства и обеспечения последовательного потока для сохранения порядка следования операций. Некоторые операции могут выполняться не по порядку, но блок загрузки/сохранения обеспечивает функциональные возможности для того, чтобы выполняемые не по порядку операции выглядели для программы выполненными по порядку, как хорошо известно из уровня техники.

[00103] Адреса, которые "видит" прикладная программа, предпочтительно часто именуются виртуальными адресами. Иногда виртуальные адреса именуются "логическими адресами" и "исполнительными адресами". Эти виртуальные адреса являются виртуальными в том смысле, что их перенаправляют в ячейку физической памяти посредством одной из ряда технологий динамической трансляции адреса (DAT), включая без ограничения простое приписывание величины смещения к виртуальному адресу, трансляцию виртуального адреса посредством одной или нескольких таблиц трансляции, которые предпочтительно содержат по меньшей мере таблицу сегментов и таблицу страниц по отдельности или в сочетании, предпочтительно таблицу сегментов, содержащую запись с указанием таблицы страниц. В системе z/Architecture предусмотрена иерархия трансляции, в которую входит первая таблица региона, вторая таблица региона, третья таблица региона, таблица сегментов и необязательная таблица страниц. Эффективность трансляции адресов часто повышается за счет использования буфера быстрого трансляции адреса (TLB), который содержит записи, отображающие виртуальный адрес соответствующей ячейки физической памяти. Записи создаются, когда DAT транслирует виртуальный адрес с использованием таблиц перевода. Затем при последующем использовании виртуального адреса может использоваться запись из быстродействующего TLB вместо доступа к таблицам медленной последовательной трансляции. Содержимым TLB может управлять ряд алгоритмов замещения, включая алгоритм замещения наиболее давней по использованию страницы (LRU).

[00104] В том случае, когда процессором является процессор мультипроцессорной системы, каждый процессор отвечает за сохранение совместно используемых ресурсов, таких как средства ввода-вывода, кэши, TLB и память, взаимно заблокированных для обеспечения непротиворечивости. Обычно для поддержания непротиворечивости кэшей используются технологии "слежения". Для облегчения совместного использования каждая строка кэша может помечаться в среде слежения как находящаяся в одном из следующих состояний, включающих состояние совместного использования, состояние монопольного использования, измененное состояние, недействительное состояние и т.п.

[00105] Устройства 5054 ввода-вывода (ФИГ.11) обеспечивают процессор средствами подключения к периферийным устройствам, включая, например, накопители на магнитной ленте, накопители на дисках, принтеры, дисплеи и сети. Блоки ввода-вывода представлены в компьютерной программе программными драйверами. В мэйнфреймах, таких как System z® производства IBM®, блоки ввода-вывода мэйнфрейма являются адаптерами каналов и адаптерами открытых систем и обеспечивают связь между операционной системой и периферийными устройствами.

[00106] Кроме того, один или несколько аспектов настоящего изобретения могут выгодно применяться в вычислительных средах других типов. В качестве примера, среда может содержать эмулятор (например, программные или другие механизмы эмуляции), в которых эмулируется конкретная архитектура (включая, например, выполнение команд, структурированные функции, такие как трансляция адреса, и структурированные регистры) или ее сокращенная версия (например, в собственной компьютерной системе, имеющей процессор и память). В такой среде за счет одной или нескольких эмулирующих функций эмулятора могут быть реализованы один или несколько аспектов настоящего изобретения, несмотря на то, что компьютер, в котором выполняется эмулятор, может иметь архитектуру, отличающуюся от эмулируемых возможностей. В качестве одного из примеров в режиме эмуляции декодируется конкретная эмулируемая команда или операция, и создается соответствующая эмулирующая функция с целью реализации отдельной команды или операции.

[00107] В эмулирующей среде хост-компьютер содержит, например, память для хранения команд и данных; блок выборки команд для выборки команд из памяти и необязательно локальной буферизации выбранных команд; блок декодирования команд для приема команд от блока выборки команд и определения типа команд, которые были выбраны; и блок выполнения команд для выполнения команд. Выполнение может предусматривать загрузку данных из памяти в регистр; сохранение данных из регистра в памяти; или выполнение арифметической или логической операции какого-либо типа, определяемой блоком декодирования. В одном из примеров каждый блок реализован посредством программного обеспечения. Например, выполняемые блоками операции реализованы в виде одной или нескольких подпрограмм в программном обеспечении эмулятора.

[00108] В частности, в мэйнфрейме структурированные машинные команды используются программаторами, обычно современными программаторами на языке "C" посредством компилирующего приложения. Эти команды, хранящиеся в запоминающей среде, могут выполняться в собственной системе команд сервера IBM® на основе z/Architecture® или в качестве альтернативы в машинах на основе других архитектур. Они могут эмулироваться в существующих и будущих серверах на основе мэйнфреймов IBM® и в других машинах IBM® (например, серверах Power Systems и серверах System x®). Они могут выполняться в операционной системе Linux разнообразными машинами, использующими аппаратное обеспечение производства IBM®, Intel®, AMD™ и других компаний. Помимо выполнения этим аппаратным обеспечением на основе Z/Architecture®, может использоваться Linux, а также машины, использующие эмуляцию Hercules, UMX или FSI (Fundamental Software, Inc), когда выполнение обычно происходит в режиме эмуляции. В режиме эмуляции эмулирующее программное обеспечение выполняется собственным процессором, эмулирующим архитектуру эмулируемого процессора.

[00109] Собственный процессор обычно выполняет эмулирующее программное обеспечение, представляющее собой аппаратно-программное обеспечение или собственную операционную систему для эмуляции эмулируемого процессора. Эмулирующее программное обеспечение отвечает за выборку и выполнение команд архитектуры эмулируемого процессора. Эмулирующее программное обеспечение поддерживает счетчик эмулируемых команд для слежения за границами команд. Эмулирующее программное обеспечение может осуществлять выборку одной или нескольких эмулируемых машинных команд за один раз и транслирование одной или нескольких эмулируемых машинных команд в соответствующую группу собственных машинных команд для выполнения собственным процессором. Эти транслированные команды могут помещаться в кэш, что позволяет ускорять транслирование. Тем не менее, эмулирующее программное обеспечение должно поддерживать правила архитектуры эмулируемого процессора с тем, чтобы обеспечивать правильную работу операционных систем и приложений, написанных для эмулируемого процессора. Кроме того, эмулирующее программное обеспечение должно обеспечивать ресурсы, указанные архитектурой эмулируемого процессора, включая без ограничения управляющие регистры, регистры общего назначения, регистры с плавающей точкой, функцию динамической трансляции адреса, включая таблицы сегментов и таблицы страниц, например, механизмы прерывания, механизмы переключения контекста, часы истинного времени (TOD) и структурированные интерфейсы с подсистемами ввода-вывода с тем, чтобы операционная система или прикладная программа, рассчитанная на работу в эмулируемом процессоре, могла быть запущена в собственном процессоре, имеющем эмулирующее программное обеспечение.

[00110] Конкретная эмулируемая команда декодируется, и вызывается подпрограмма для выполнения функции отдельной команды. Функция эмулирующего программного обеспечения, эмулирующая функцию эмулируемого процессора, реализуется, в подпрограмме или драйвере на языке "С" или каким-либо другим способом обеспечения драйвера для конкретного аппаратного обеспечения, доступным для специалистов в данной области техники, ознакомившихся в описанием предпочтительного варианта осуществления. В различных патентах, в которых предложена эмуляция программного и аппаратного обеспечения, включая без ограничения патент US 5551013 под названием "Multiprocessor for hardware emulation", выданный на имя Beausoleil и др., патент US 6009261 под названием "Preprocessing of stored target routines for emulating incompatible instructions on a target processor", выданный на имя Scaizi и др.; патент US 5574873 под названием "Decoding guest instruction to directly access emulation routines that emulate the guest instructions", выданный на имя Davidian и др.; патент US 6308255 под названием "Symmetrical multiprocessing bus and chipset used for coprocessor support allowing non-native code to run in a system", выданный на имя Gorishek и др.; патент US 6463582 под названием "Dynamic optimizing object code translator for architecture emulation and dynamic optimizing object code translation method", выданный на имя Lethin и др.; патент US 5790825 под названием "Method for emulating guest instructions on a host computer through dynamic recompilation of host instructions", выданный на имя Eric Traut; каждый из которых включен в данное описание во всей их полноте, и многие другие, проиллюстрированные разнообразные известные способы эмуляции формата команд, структурированного для отличающейся машины, в целевой машине, доступные для специалистов в данной области техники.

[00111] На ФИГ.13 проиллюстрирован один из примеров известной из техники эмулирующей компьютерной хост-системы 5092, которая эмулирует компьютерную хост-систему 5000', имеющую хост-архитектуру. Хост-процессором (ЦП) 5091 в компьютерной хост-системе 5092 эмуляции является хост-процессор (или виртуальный хост-процессор) эмуляции, представляющий собой процессор 5093 эмуляции со структурой собственных команд, отличающейся от структуры команд процессора 5091 хост-компьютера 5000'. Компьютерная хост-система 5092 эмуляции имеет память 5094, доступную для процессора 5093 эмуляции. В примере осуществления память 5094 разделена на память 5096 хост-компьютера и память 5097 программ эмуляции. Память 5096 хост-компьютера доступна для программ эмулируемого хост-компьютера 5092 в зависимости от архитектуры хост-компьютера. Процессор 5093 эмуляции выполняет собственные команды структурированной системы команд, структура которых отличается от структуры команд эмулируемого процессора 5091 и которые извлекаются из памяти 5097 программ эмуляции, и может осуществлять выборку хост-команды для выполнения из программы в памяти 5096 хост-компьютера путем применения одной или нескольких команд из программы контроля последовательности и выборки/декодирования (Sequence & Access/Decode), которая может декодировать выбранную хост-команду(-ы) и определять программу выполнения собственных команд эмуляции функции выбранной хост-команды. Другие средства, которые предусмотрены в архитектуре компьютерной хост-системы 5000', могут эмулироваться программами структурированных средств (Architected Facilities Routines), включая такие средства, как, например, регистры общего назначения, управляющие регистры, поддержка подсистемы динамической трансляции адреса и ввода-вывода и кэш-память процессора. Программы эмуляции также могут использовать функции, доступные в процессоре 5093 эмуляции (такие как общие регистры и динамическое транслирование виртуальных адресов) для повышения производительности программ эмуляции. Также может быть предусмотрено особое программное обеспечение и механизмы разгрузки, облегчающие процессору 5093 эмуляцию функции хост-компьютера 5000'.

[00112] Используемая в описании терминология имеет целью описание лишь частных вариантов осуществления, а не ограничение настоящего изобретения. Подразумевается, что используемые в описании формы единственного числа включают также формы множественного числа, если из контекста ясно не следует иное. Дополнительно подразумевается, что термины "содержит" и/или "содержащий", используемые в описании, означают присутствие указанных признаков, чисел, шагов, операций, элементов и/или компонентов, но не исключают присутствие или добавление одного или нескольких других признаков, чисел, шагов, операций, элементов, компонентов и/или их групп.

[00113] Подразумевается, что соответствующие структуры, материалы, действия и эквиваленты всех элементов "средство или шаг плюс функция" следующей далее формулы изобретения, если таковые существуют, включают любую структуру, материал или действие для выполнения функции в сочетании с другими конкретно заявленными средствами. Описание одного или более из аспектов настоящего изобретения представлено в качестве иллюстрации и не имеет целью исчерпать или ограничить изобретение раскрытой формой. Для специалистов в данной области техники бесспорны многочисленные модификации и разновидности без отступления от сути и объема настоящего изобретения. Выбранный и описанный вариант осуществления имеет целью наилучшим образом пояснить принципы настоящего изобретения и его практическое применение, а также позволить специалистам в данной области техники понять различные варианты осуществления настоящего изобретения с различными модификациями, рассчитанными на конкретное применение.

Глава 23. Векторные строковые команды

Векторное строковое средство

Команды

Если не определено иное, все операнды являются векторно-регистровыми операндами. "V" в синтаксисе ассемблера обозначает векторный операнд.

Названий Обозначение Характеристики Код операции Страница
VECTOR FIND ANY EQUAL VFAE VRR-b C* VF Q9 Dv E782 23-1
VECTOR FIND ELEMENT EQUAL VFEE VRR-b C* VF Q9 Dv E780 23-2
VECTOR FIND ELEMENT NOT EQUAL VFENE VRR-b C* VF Q9 Dv E781 23-3
VECTOR STRING RANGE COMPARE VSTRC VRR-d C* VF Q9 Dv Е78А 23-4
VECTOR FIND ANY EQUAL (найти любые одинаковые значения вектора)

При продвижении слева направо, каждый беззнаковый целый двоичный элемент второго операнда сравнивается на совпадение с каждым беззнаковым целым двоичным элементом третьего операнда, и опционально с нулем, если установлен флаг поиска нуля (ZS) в поле M5.

Если флаг типа результата (RT) в поле M5 равен нулю, то для каждого элемента во втором операнде, который совпадает с любым элементом в третьем операнде, или опционально с нулем, двоичные разряды соответствующего элемента в первом операнде устанавливаются в единицу, иначе они устанавливаются в нуль.

Если флаг типа результата (RT) в поле M5 равен единице, то индекс байта крайнего левого элемента во втором операнде, который совпадает с элементом в третьем операнде, или с нулем, сохраняется в байте семь первого операнда.

Каждая команда имеет раздел "Расширенные обозначения", который описывает рекомендуемые расширенные мнемонические обозначения и соответствующий им синтаксис ассемблера машины.

Примечание о программировании: Для всех команд, которые опционально устанавливают код состояния, производительность может быть снижена, если код состояния установлен.

Если флаг типа результата (RT) в поле M5 равен единице, и не обнаружены одинаковые байты или равные нулю, если установлен флаг поиска нуля, индекс, равный числу байт в векторе, сохраняется в байте семь первого операнда.

Поле M4 определяет директиву размера элемента (ES, element size,). Директива ES определяет размер элементов в операндах векторного регистра. Если определено зарезервированное значение, обнаруживается исключение определения.

0 - байт

1 - полуслово

2 - слово

3-15 - зарезервированы

Поле M5 имеет следующий формат:

Биты поля M5 определяются следующим образом:

- Тип результата (Result Type, RT): Если нуль, каждый результирующий элемент является маской сравнений всех диапазонов по этому элементу. Если один, индекс байта сохраняется в байте семь первого операнда, а во всех других элементах сохраняются нули.

- Поиск нуля (Zero Search, ZS): Если один, каждый элемент второго операнда сравнивается также с нулем.

- Установка кода состояния (Condition Code, CC): Если нуль, код состояния не устанавливается и остается неизменным. Если один, код состояния устанавливается, как определено в следующем разделе.

Особые состояния

Обнаруживается исключение определения и не предпринимаются другие действия, если происходит что-либо из следующего:

1. Поле M4 содержит значение 3-15.

2. Бит 0 поля M5 не нуль.

Результирующий код состояния:

Если флаг CC нуль, код остается неизменным.

Если флаг CC один, код устанавливается следующим образом:

0 Если бит ZS установлен, не было совпадений в элементе с низшим индексом, чем нуль во втором операнде.

1. Некоторые элементы второго операнда совпадают по меньшей мере с одним элементом в третьем операнде.

2. Все элементы второго операнда совпали по меньшей мере с одним элементом в третьем операнде.

3. Ни один из элементов во втором операнде не совпадает с какими-либо элементами в третьем операнде.

Программные исключения:

- Данные с DXC FE, векторный регистр

- Операция, если средство векторного расширения не установлено

- Определение (зарезервированное значение ES)

- Ограничение транзакции

Расширенные обозначения:

VFAEB V1, V2, V3, M5 VFAE V1, V2, V3, 0, M5
VFAEH V1, V2, V3, M5 VFAE V1, V2, V3, 1, M5
VFAEF V1, V2, V3, M5 VFAE V1, V2, V3, 2, M5
VFAEBS V1, V2, V3, M5 VFAE V1, V2, V3, 0, (M5|X'1')
VFAEHS V1, V2, V3, M5 VFAE V1, V2, V3, 1, (M5|X'1')
VFAEFS V1, V2, V3, M5 VFAE V1, V2, V3, 2, (M5|X'1')
VFAEZB V1, V2, V3, M5 VFAE V1, V2, V3, 0, (M5|X'2')
VFAEZH V1, V2, V3, M5 VFAE V1, V2, V3, 1, (M5|X'2')
VFAEZF V1, V2, V3, M5 VFAE V1, V2, V3, 2, (M5|X'2')
VFAEZBS V1, V2, V3, M5 VFAE V1, V2, V3, 0, (M5|X'3')
VFAEZHS V1, V2, V3, M5 VFAE V1, V2, V3, 1, (M5|X'3')
VFAEZFS V1, V2, V3, M5 VFAE V1, V2, V3, 2, (M5|X'3')
VECTOR FIND ELEMENT EQUAL (найти одинаковый соответствующий элемент вектора)

При продвижении слева направо, беззнаковые целые двоичные элементы второго операнда сравнивается с соответствующими беззнаковыми целыми двоичными элементами третьего операнда. Если два элемента равны, индекс байта первого байта самого левого равного элемента помещается в байт семь первого операнда. В оставшихся байтах первого операнда сохраняются нули. Если не обнаружены одинаковые байты или равные нулю, если установлен флаг сравнения с нулем, индекс, равный числу байт в векторе, сохраняется в байте семь первого операнда. В оставшихся байтах сохраняются нули.

Если бит поиска нуля (ZS) установлен в поле M5, то каждый элемент во втором операнде сравнивается также на равенство с нулем. Если нулевой элемент найден во втором операнде до того, как будут найдены любые другие равные элементы второго и третьего операндов, индекс байта первого байта элемента, найденного равным нулю, сохраняется в байте семь первого операнда, а во всех других байтовых ячейках сохраняются нули. Если флаг установки кода состояния (СС) равен одному, то код состояния устанавливается в нуль.

Поле M4 определяет директиву размера элемента (ES). Директива ES определяет размер элементов в операндах векторного регистра. Если определено зарезервированное значение, обнаруживается исключение определения.

0 - байт

1 - полуслово

2 - слово

3-15 - зарезервированы

Поле M5 имеет следующий формат:

Биты поля M5 определяются следующим образом:

- Зарезервировано: Биты 0-1 зарезервированы и должны быть равны нулю. Иначе, обнаруживается исключение определения.

- Поиск нуля (Zero Search, ZS): Если один, каждый элемент второго операнда сравнивается также с нулем.

- Установка кода состояния (Condition Code, CC): Если нуль, код состояния остается неизменным. Если один, код состояния устанавливается, как определено в следующем разделе.

Особые состояния

Обнаруживается исключение определения и не предпринимаются другие действия, если происходит что-либо из следующего:

1. Поле M4 содержит значение 3-15.

2. Биты 0-1 поля M5 не нулевые.

Результирующий код состояния:

Если бит 3 поля M5 установлен в единицу, код устанавливается следующим образом:

0 Если бит сравнения с нулем установлен, сравнение обнаружило нулевой элемент во втором операнде в элементе с меньшим индексом, чем какие-либо сравнения на равенство.

1 Сравнение обнаружило совпадение между вторым и третьим операндами в некотором элементе. Если установлен бит сравнения с нулем, совпадение произошло в элементе с индексом, меньшим или равным элементу сравнения с нулем.

2 --

3 Равные элементы не обнаружены.

Если бит 3 поля M5 нуль, код остается неизменным.

Программные исключения:

- Данные с DXC FE, векторный регистр

- Операция, если средство векторного расширения не установлено

- Определение (зарезервированное значение ES)

- Ограничение транзакции

Расширенные обозначения:

VFEEB V1, V2, V3, M5 VFEE V1, V2, V3, 0, M5
VFEEH V1, V2, V3, M5 VFEE V1, V2, V3, 1, M5
VFEEF V1, V2, V3, M5 VFEE V1, V2, V3, 0, (M5|X'1')
VFEEHS V1, V2, V3, M5 VFEE V1, V2, V3, 1, (M5|X'1')
VFEEFS V1, V2, V3, M5 VFEE V1, V2, V3, 2, (M5|X'1')
VFEEZB V1, V2, V3, M5 VFEE V1, V2, V3, 0, (M5|X'2')
VFEEZH V1, V2, V3, M5 VFEE V1, V2, V3, 1, (M5|X'2')
VFEEZF V1, V2, V3, M5 VFEE V1, V2, V3, 2, (M5|X'2')
VFEEZBS V1, V2, V3, M5 VFEE V1, V2, V3, 0, (M5|X'3')
VFEEZHS V1, V2, V3, M5 VFEE V1, V2, V3, 1, (M5|X'3')
VFEEZFS V1, V2, V3, M5 VFEE V1, V2, V3, 2, (M5|X'3')

Примечания о программировании:

1. Индекс байта всегда сохраняется в первом операнде для любого размера элемента. Например, если размер элемента установлен равным полуслову, и полуслово со 2 индексом оказалось равным, то будет сохраняться индекс байта 4.

2. Третий операнд не должен содержать элементов с нулевым значением. Если третий операнд не содержит нуля, и он совпадает с нулевым элементом во втором операнде перед любыми другими сравнениями на равенство, код состояния устанавливается в единицу безотносительно к установке бита сравнения с нулем.

VECTOR FIND ELEMENT NOT EQUAL (найти неодинаковый соответствующий элемент вектора)

При продвижении слева направо, беззнаковые целые двоичные элементы второго операнда сравнивается с соответствующими беззнаковыми целыми двоичными элементами третьего операнда. Если два элемента не равны, индекс байта крайнего левого неравного элемента помещается в байт семь первого операнда, а во все другие байты сохраняются нули. Если бит установки кода состояния (СС) в поле M5 установлен в единицу, код состояния устанавливается так, чтобы обозначать, который операнд был больше. Если все элементы были равны, то индекс байта, равный размеру вектора, помещается в байт семь первого операнда, а во все другие байтовые ячейки помещаются нули. Если бит СС равен единице, устанавливается код состояния три.

Если бит поиска нуля (ZS) установлен в поле M5, каждый элемент во втором операнде сравнивается также на равенство с нулем. Если нулевой элемент найден во втором операнде до того, как будут найдены любые другие неравные элементы второго операнда, индекс байта первого байта элемента, найденного равным нулю, сохраняется в байте семь первого операнда. Во всех других байтах сохраняются нули, и устанавливается код состояния 0.

Поле M4 определяет директиву размера элемента (ES). Директива ES определяет размер элементов в операндах векторного регистра. Если определено зарезервированное значение, обнаруживается исключение определения.

0 - байт

1 - полуслово

2 - слово

3-15 - зарезервированы

Поле M5 имеет следующий формат:

Биты поля M5 определяются следующим образом:

- Поиск нуля (Zero Search, ZS): Если один, каждый элемент второго операнда сравнивается также с нулем.

- Установка кода состояния (Condition Code, CC): Если нуль, код состояния не устанавливается и остается неизменным. Если один, код состояния устанавливается, как определено в следующем разделе.

Особые состояния

Обнаруживается исключение определения и не предпринимаются другие действия, если происходит что-либо из следующего:

1. Поле M4 содержит значение 3-15.

2. Биты 0-1 поля M5 не нулевые.

Результирующий код состояния:

Если бит 3 поля M5 установлен в единицу, код устанавливается следующим образом:

0. Если бит сравнения с нулем установлен, сравнение обнаружило нулевой элемент в обоих операндах в элементе с меньшим индексом, чем какие-либо сравнения на неравенство.

1. Было обнаружено несовпадение элементов, и элемент в VR2 меньше, чем элемент в VR3

2. Было обнаружено несовпадение элементов, и элемент в VR2 больше, чем элемент в VR3

3. Все элементы оказались равны, и, если бит сравнения с нулем установлен, не были обнаружены нулевые элементы во втором операнде.

Если бит 3 поля M5 нуль, код остается неизменным.

Программные исключения:

- Данные с DXC FE, векторный регистр

- Операция, если средство векторного расширения не установлено

- Определение (зарезервированное значение ES)

- Ограничение транзакции

Расширенные обозначения:

VFENEB V1, V2, V3, M5 VFENE V1, V2, V3, 0, M5
VFENEH V1, V2, V3, M5 VFENE V1, V2, V3, 1, M5
VFENEF V1, V2, V3, M5 VFENE V1, V2, V3, 2, M5
VFENEBS V1, V2, V3, M5 VFENE V1, V2, V3, 0, (M5|X'1')
VFENEHS V1, V2, V3, M5 VFENE V1, V2, V3, 1, (M5|X'1')
VFENEFS V1, V2, V3, M5 VFENE V1, V2, V3, 2, (M5|X'1')
VFENEZB V1, V2, V3, M5 VFENE V1, V2, V3, 0, (M5|X'2')
VFENEZH V1, V2, V3, M5 VFENE V1, V2, V3, 1, (M5|X'2')
VFENEZF V1, V2, V3, M5 VFENE V1, V2, V3, 2, (M5|X'2')
VFENEZBS V1, V2, V3, M5 VFENE V1, V2, V3, 0, (M5|X'3'))
VFENEZHS V1, V2, V3, M5 VFENE V1, V2, V3, 1, (M5|X'3')
VFENEZFS V1, V2, V3, M5 VFENE V1, V2, V3, 2, (M5|X'3')
VECTOR STRING RANGE COMPARE (сравнить векторы в диапазоне строк)

При продвижении слева направо, беззнаковые целые двоичные элементы второго операнда сравнивается с диапазонами значений, определенных четно-нечетными парами элементов в третьем и четвертом операндах. Комбинированные с контрольными значениями из четвертого операнда определяют диапазон сравнений для выполнения. Если элемент совпадает с любым из диапазонов, определенных третьим и четвертым операндами, это считается совпадением.

Если флаг типа результата (RT) в поле M6 равен нулю, двоичные разряды элемента в первом операнде, соответствующие элементу, с которым он сравнивается, во втором операнде, устанавливаются в единицу, если элемент совпадает с любым из диапазонов, иначе же они устанавливаются в нуль.

Если флаг типа результата (RT) в поле M6 установлен в единицу, индекс байта первого элемента во втором операнде, который совпадает с любым из диапазонов, определенных вторым и третьим операндами, или сравнением с нулем, если флаг ZS установлен в единицу, помещается в байт семь первого операнда, а в оставшиеся байты сохраняются нули. Если нет совпадений элементов, то индекс, равный числу байт в векторе, помещается в байт семь первого операнда, а в оставшиеся байты сохраняются нули.

Флаг поиска нуля (ZS) в поле M6, будучи установлен в единицу, добавит сравнение с нулем элементов второго операнда по диапазонам, заданным третьим и четвертым операндами. Если сравнение с нулем в элементе с низшим индексом, чем любое другое истинное сравнение, то код состояния устанавливается в нуль.

Операнды содержат элементы размера, заданного директивой размера элемента (Element Size, ES) в поле M5.

Элементы четвертого операнда имеют следующий формат:

Если ES равно 0:

Биты в элементах четвертого операнда определяются следующим образом:

- Равно (Equal, EQ): Если единица, выполняется сравнение на равенство.

- Больше чем (Greater Than, GT): Если единица, выполняется сравнение по соотношению больше.

- Меньше чем (Less Than, LT): Если единица, выполняется сравнение по соотношению меньше.

- Все другие биты зарезервированы и должны быть равны нулю для обеспечения совместимости в будущем.

Директивные биты могут использоваться в любом сочетании. Если ни один бит не установлен, сравнение всегда будет выдавать ложный результат. Если все биты установлены, сравнение всегда будет выдавать истинный результат.

Поле M5 определяет директиву размера элемента (ES). Директива ES определяет размер элементов в операндах векторного регистра. Если определено зарезервированное значение, обнаруживается исключение определения.

0 - байт

1 - полуслово

2 - слово

3-15 - зарезервированы

Поле M6 имеет следующий формат:

Биты поля M6 определяются следующим образом:

- Инвертировать результат (Invert Result, IN): Если нуль, сравнение происходит с парами значений в управляющем векторе. Если один, результат пар сравнений в диапазонах инвертируется.

- Тип результата (Result Type, RT): Если нуль, каждый результирующий элемент является маской сравнений всех диапазонов по этому элементу. Если один, индекс сохраняется в байте семь первого операнда. В оставшихся байтах сохраняются нули.

- Поиск нуля (Zero Search, ZS): Если один, каждый элемент второго операнда сравнивается также с нулем.

- Установка кода состояния (Condition Code, CC): Если нуль, код состояния не устанавливается и остается неизменным. Если один, код состояния устанавливается, как определено в следующем разделе.

Особые состояния

Обнаруживается исключение определения и не предпринимаются другие действия, если происходит что-либо из следующего:

1. Поле M4 содержит значение 3-15.

Результирующий код состояния:

0 Если ZS = 1 и найден нуль в элементе с низшим индексом, чем какое-либо сравнение

1 Найдено сравнение

2 --

3 Не найдено сравнение

Программные исключения:

- Данные с DXC FE, векторный регистр

- Операция, если средство векторного расширения не установлено

- Определение (зарезервированное значение ES)

- Ограничение транзакции

Расширенные обозначения:

VSTRCB V1, V2, V3, V4, M6 VSTRC V1, V2, V3, V4, 0, M6
VSTRCH V1, V2, V3, V4, M6 VSTRC V1, V2, V3, V4, 1, M6
VSTRCF V1, V2, V3, V4, M6 VSTRC V1, V2, V3, V4, 2, M6
VSTRCBS V1, V2, V3, V4, M6 VSTRC V1, V2, V3, V4, 0 (M6|X'1')
VSTRCHS V1, V2, V3, V4, M6 VSTRC V1, V2, V3, V4, 1, (M6|X'1')
VSTRCFS V1, V2, V3, V4, M6 VSTRC V1, V2, V3, V4, 2, (M6|X'1')
VSTRCZB V1, V2, V3, V4, M6 VSTRC V1, V2, V3, V4, 0, (M6|X'2')
VSTRCZH V1, V2, V3, V4, M6 VSTRC V1, V2, V3, V4, 1, (M6|X'2')
VSTRCZF V1, V2, V3, V4, M6 VSTRC V1, V2, V3, V4, 2, (M6|X'2')
VSTRCZBS V1, V2, V3, V4, M6 VSTRC V1, V2, V3, V4, 0, (M6|X'3')
VSTRCZHS V1, V2, V3, V4, M6 VSTRC V1, V2, V3, V4, 1, (M6|X'3')
VSTRCZFS V1, V2, V3, V4, M6 VSTRC V1, V2, V3, V4, 2, (M6|X'3')

32-битное двоичное беззнаковое целое, содержащее число бит, которое возможно загрузить от местонахождения второго операнда без пересечения заданной границы блока, ограниченное шестнадцатью, помещается в первый операнд.

Смещение рассматривается как 12-битное беззнаковое целое.

Адрес второго операнда не используется для адресации данных.

Поле M3 определяет код, который используется для сообщения ЦПУ о размере границы блока для вычисления количества возможных загружаемых байт. Если определено зарезервированное значение, то обнаруживается исключение определения.

Код Граница
0 64 байта
1 128 байт
2 256 байт
3 512 байт
4 1 кбайт
5 2 кбайта
6 4 кбайт
7-15 зарезервированы

Результирующий код состояния:

0 Операнд один равен шестнадцати

1 --

2 --

3 Операнд один меньше шестнадцати

Результирующий код состояния:

Программные исключения:

- Операция, если средство векторного расширения не установлено

- Определение

Примечание о программировании: Ожидается, что LOAD COUNT TO BLOCK-BOUNDARY будет использоваться совместно с VECTOR LOAD TO BLOCK BOUNDARY для определения количества байт, которые были загружены.

VECTOR LOAD GR FROM VR ELEMENT (загрузить вектор в регистр общего назначения из элемента векторного регистра)

Элемент третьего операнда размера, заданного значением ES в поле M4, и обозначенного адресом второго операнда, помещается в ячейку первого операнда. Третий операнд является векторным регистром. Первый операнд является регистром общего назначения. Если индекс, заданный адресом второго операнда, больше, чем элемент с наивысшим номером в третьем операнде, заданного размера элемента, данные в первом операнде непредсказуемы.

Если элемент векторного регистра меньше, чем двойное слово, элемент выравнивается вправо в 64-битном регистре общего назначения, а оставшиеся биты заполняют нули.

Адрес второго операнда не используется для адресации данных; вместо этого крайние правые 12 бит адреса используются для задания индекса элемента внутри второго операнда.

Поле M4 определяет директиву размера элемента (ES). Директива ES определяет размер элементов в операндах векторного регистра. Если определено зарезервированное значение, обнаруживается исключение определения.

0 - байт

1 - полуслово

2 - слово

3 - двойное слово

4-15 - зарезервированы неизменными.

Результирующий код состояния: Код не изменяется.

Программные исключения:

- Данные с DXC FE, векторный регистр

- Операция, если средство векторного расширения не установлено

- Определение (зарезервированное значение ES)

- Ограничение транзакции

Расширенные обозначения:

VLGVB R1, V3, D2 (B2) VLGV R1, V3, D2 (B2), 0
VLGVH R1, V3, D2 (B2) VLGV R1, V3, D2 (B2), 1
VLGVF R1, V3, D2 (B2) VLGV R1, V3, D2 (B2), 2
VLGVG R1, V3, D2 (B2) VLGV R1, V3, D2 (B2), 3
VECTOR LOAD TO BLOCK BOUNDARY (загрузить вектор до границы блока)

Первый операнд загружается, начиная с элемента байта с нулевым номером, байтами из второго операнда. Если встречается граничное условие, остаток первого операнда непредсказуем. Исключения доступа не обнаруживаются на байтах, которые не загружены.

Смещение для VLBB рассматривается как 12-битное беззнаковое целое.

Поле M3 определяет код, который используется для сообщения ЦПУ о границе блока, до которой следует загрузиться. Если определено зарезервированное значение, обнаруживается исключение определения.

Код Граница
0 64 байта
1 128 байт
2 256 байт
3 512 байт
4 1 кбайт
5 2 кбайта
6 4 кбайт
7-15 зарезервированы

Результирующий код состояния: Код остается неизменным.

Программные исключения:

- Доступ (считывание, операнд 2)

- Данные с DXC FE, векторный регистр

- Операция, если средство векторного расширения не установлено

- Определение (зарезервированный код границы блока)

- Ограничение транзакции

Примечания о программировании:

1. В определенных обстоятельствах данные могут загружаться после границы блока. Однако, это будет происходить только если нет исключений доступа на этих данных.

VECTOR STORE (сохранить вектор)

128-битное значение в первом операнде сохраняется в ячейке памяти, определенной вторым операндом. Смещение для VST рассматривается как 12-битное беззнаковое целое.

Результирующий код состояния: Код остается неизменным.

Программные исключения:

- Доступ (запись, операнд 2)

- Данные с DXC FE, векторный регистр

- Операция, если средство векторного расширения не установлено

- Ограничение транзакции

VECTOR STORE WITH LENGTH (сохранить вектор с длиной)

При продвижении слева направо, байты из первого операнда сохраняются в ячейке второго операнда. Определенный регистром общего назначения, третий операнд содержит 32-битное беззнаковое целое, содержащее значение, которое представляет байт с наивысшим индексом для сохранения. Если третий операнд содержит значение, большее или равное байту с наивысшим индексом вектора, все байты первого операнда сохраняются.

Исключения доступа обнаруживаются только на байтах, которые сохраняются.

Смещение для VECTOR STORE WITH LENGTH рассматривается как 12-битное беззнаковое целое.

Результирующий код состояния: Код состояния остается неизменным.

Программные исключения:

- Доступ (запись, операнд 2)

- Данные с DXC FE, векторный регистр

- Операция, если средство векторного расширения не установлено

- Ограничение транзакции

Описание RXB

Все векторные команды имеют поле в битах 36-40 команды, обозначенное как RXB. Это поле содержит самые старшие биты для всех операндов, обозначенных векторным регистром. Биты для обозначений регистров, не заданных командой, зарезервированы и должны быть установлены в нуль; иначе, программа не сможет совместимо работать в будущем. Самый старший бит приписывается слева к четырехбитному обозначению регистра для создания пятибитного обозначения векторного регистра.

Биты определяются следующим образом:

0. Самый старший бит для обозначения векторного регистра в битах 8-11 команды.

1. Самый старший бит для обозначения векторного регистра в битах 12-15 команды.

2. Самый старший бит для обозначения векторного регистра в битах 16-19 команды.

3. Самый старший бит для обозначения векторного регистра в битах 32-35 команды.

Директива задействования вектора

Векторные регистры и команды могут использоваться только если директива задействования вектора (бит 46) и директива регистра AFP (бит 45) в управляющем регистре нуль установлены в единицу. Если векторное средство установлено, а векторная команда выполняется без задействования этого набора бит, обнаруживается исключение данных с DXC FE шестнадцатеричным. Если векторное средство не установлено, обнаруживается исключение операции.

1. Машиночитаемый носитель данных, в котором хранятся команды, считываемые и выполняемые обрабатывающим устройством в центральном процессорном устройстве для выполнения способа, включающего:
получение процессором машинной команды для выполнения, причем машинная команда определена для выполнения компьютером согласно архитектуре компьютера и включает:
по меньшей мере одно поле кода операции для предоставления кода операции, причем код операции идентифицирует операцию загрузки до границы блока;
поле регистра, используемое для обозначения регистра, причем регистр включает первый операнд;
по меньшей мере одно поле для обнаружения второго операнда в основной памяти; и
указатель размера границы блока для указания заданной границы блока второго операнда; и
выполнение машинной команды, включающее загрузку переменного количества данных из блока второго операнда в первый операнд с обеспечением загрузки в первый операнд только данных, которые находятся внутри блока, причем загрузка из блока начинается с предоставляемого машинной командой начального адреса в блоке второго операнда и заканчивается на заданной границе блока второго операнда или до нее.

2. Машиночитаемый носитель данных по п. 1, в котором по меньшей мере одно поле включает поле смещения, базовое поле и индексное поле, причем базовое поле и индексное поле для обнаружения регистров общего назначения имеет содержимое для добавления к содержимому поля смещения для формирования адреса второго операнда, и в котором машинная команда дополнительно включает поле маски, причем поле маски задает указатель размера границы блока.

3. Машиночитаемый носитель данных по п. 2, в котором граница блока является одной границей блока из множества границ блока, задаваемого полем маски.

4. Машиночитаемый носитель данных по п. 1, в котором адрес второго операнда является указанным начальным адресом в памяти, из которой данные следует загрузить в первый операнд.

5. Машиночитаемый носитель данных по п. 4, в котором выполнение дополнительно включает выявление конечного адреса, на котором следует остановить загрузку, и в котором загрузка останавливается на конечном адресе.

6. Машиночитаемый носитель данных по п. 5, в котором выявление конечного адреса включает вычисление конечного адреса следующим образом:
конечный адрес = минимуму из (начальный адрес + (размер границы - (начальный адрес И НЕ маска границы)), начальный адрес + размер регистра), причем размер границы представляет собой границу блока, маска границы равна 0 - размер границы, и размер регистра представляет собой заданную длину регистра.

7. Машиночитаемый носитель данных по п. 1, в котором загрузка включает загрузку данных в первый операнд слева направо или справа налево.

8. Машиночитаемый носитель данных по п. 7, в котором направление загрузки предоставляется при выполнении.

9. Машиночитаемый носитель данных по п. 1, в котором машинная команда дополнительно включает поле расширения, используемое для определения одного или более регистров, и в котором поле регистра комбинируют с по крайней мере частью поля расширения для определения регистра.

10. Машиночитаемый носитель данных по п. 1, в котором загрузка первого операнда начинается с индексного байта 0 первого операнда и продолжается до максимального индекса байта регистра.

11. Машиночитаемый носитель данных по п. 1, в котором загружаемое переменное количество данных основано на начальном адресе и заданной границе блока, определяемой по указателю размера границы блока, причем переменное количество данных представляет собой минимум из количества байтов в первом операнде и количества байтов, загруженных до заданной границы блока.

12. Компьютерная система для выполнения машинной команды в центральном процессорном устройстве, содержащая:
память; и
процессор, сообщающийся с памятью, причем компьютерная система настроена для осуществления способа, включающего:
получение процессором машинной команды для выполнения, причем машинная команда определена для выполнения компьютером согласно архитектуре компьютера и включает:
по меньшей мере одно поле кода операции для предоставления кода операции, причем код операции идентифицирует операцию загрузки до границы блока;
поле регистра, используемое для обозначения регистра, причем регистр включает первый операнд;
по меньшей мере одно поле для обнаружения второго операнда в основной памяти; и
указатель размера границы блока для указания заданной границы блока второго операнда; и
выполнение машинной команды, включающее: загрузку переменного количества данных из блока второго операнда в первый операнд с обеспечением загрузки в первый операнд только данных, которые находятся внутри блока, причем загрузка из блока начинается с предоставляемого машинной командой начального адреса в блоке второго операнда и заканчивается на заданной границе блока второго операнда или до нее.

13. Компьютерная система по п. 12, в которой по меньшей мере одно поле включает поле смещения, базовое поле и индексное поле, причем базовое поле и индексное поле для обнаружения регистров общего назначения имеет содержимое для добавления к содержимому поля смещения для формирования адреса второго операнда, и в котором машинная команда дополнительно включает поле маски, причем поле маски задает указатель размера границы блока.

14. Компьютерная система по п. 12, в которой адрес второго операнда является указанным начальным адресом в памяти, из которой данные следует загрузить в первый операнд, и в которой выполнение дополнительно включает выявление конечного адреса, на котором следует остановить загрузку, и в котором загрузка останавливается на конечном адресе.

15. Компьютерная система по п. 14, в которой выявление конечного адреса включает вычисление конечного адреса следующим образом:
конечный адрес = минимуму из (начальный адрес + (размер границы - (начальный адрес И НЕ маска границы)), начальный адрес + размер регистра), причем размер границы представляет собой границу блока, маска границы равна 0 - размер границы, и размер регистра представляет собой заданную длину регистра.

16. Компьютерная система по п. 12, в которой загрузка включает загрузку первого операнда слева направо или загрузку первого операнда справа налево.

17. Компьютерная система по п. 16, в которой направление загрузки предоставляется динамически.

18. Компьютерная система по п. 12, в которой машинная команда дополнительно включает поле расширения, используемое для определения одного или более регистров, причем поле регистра суммируется с по крайней мере частью поля расширения для определения регистра.

19. Компьютерная система по п. 12, в которой загружаемое переменное количество данных основано на начальном адресе и заданной границе блока, определяемой по указателю размера границы блока, причем переменное количество данных представляет собой минимум из количества байтов в первом операнде и количества байтов, загруженных до заданной границы блока.

20. Способ выполнения машинной команды в центральном процессорном устройстве, включающий:
получение процессором машинной команды для выполнения, причем машинная команда определена для выполнения компьютером согласно архитектуре компьютера и включает:
по меньшей мере одно поле кода операции для предоставления кода операции, причем код операции идентифицирует операцию загрузки до границы блока;
поле регистра, используемое для обозначения регистра, причем регистр включает первый операнд;
по меньшей мере одно поле для обнаружения второго операнда в основной памяти; и
указатель размера границы блока для указания заданной границы блока второго операнда; и
выполнение машинной команды, включающее: загрузку переменного количества данных из блока второго операнда в первый операнд с обеспечением загрузки в первый операнд только данных, которые находятся внутри блока, причем загрузка из блока начинается с предоставляемого машинной командой начального адреса в блоке второго операнда и заканчивается на заданной границе блока второго операнда или до нее.

21. Способ по п. 20, в котором адрес второго операнда является начальным адресом в памяти, из которой данные следует загрузить в первый операнд, и в которой выполнение дополнительно включает выявление конечного адреса, на котором следует остановить загрузку, и в котором загрузка останавливается на конечном адресе.

22. Способ по п. 20, в котором выявление конечного адреса включает вычисление конечного адреса следующим образом:
конечный адрес = минимуму из (начальный адрес + (размер границы - (начальный адрес И НЕ маска границы)), начальный адрес + размер регистра), причем размер границы представляет собой границу блока, маска границы равна 0 - размер границы, и размер регистра представляет собой заданную длину регистра.

23. Способ по п. 20, в котором загружаемое переменное количество данных основано на начальном адресе и заданной границе блока, определяемой по указателю размера границы блока, причем переменное количество данных представляет собой минимум из количества байтов в первом операнде и количества байтов, загруженных до заданной границы блока.



 

Похожие патенты:

Изобретение относится к области функциональных возможностей команд процессора компьютерной системы. Техническим результатом является повышение эффективности выполнения неделимых операций.

Изобретение относится к области обработки операций ввода-вывода в вычислительной среде. Техническим результатом является повышение эффективности связи с адаптерами вычислительной среды.

Изобретение относится к области систем обработки данных, имеющих множество аппаратных режимов работы, а также к управлению доступом к памяти в зависимости от текущего аппаратного режима.

Изобретение относится к вычислительной технике, а конкретнее к механизмам для защищенной начальной загрузки операционной системы, которая препятствует мошенническим компонентам быть загруженным операционной системой и таким образом предотвращает разглашение системного ключа при несоответствующих обстоятельствах.

Изобретение относится к планированию доступа к устройству хранения и более конкретно к предотвращению работы программы, которая выполняется, от монополизации доступа к запоминающему устройству.

Изобретение относится к доставке контента, в частности к его загрузке. .

Изобретение относится к системам обработки данных. .
Изобретение относится к вычислительной технике. .

Изобретение относится к системам обработки данных. .

Изобретение относится к области телекоммуникации, связи и передачи данных. Технический результат заключается в увеличении скорости в обработке сетевых заголовков, что повышает скорость и достигается за счет применения устройства приема и передачи данных с возможностью осуществления взаимодействия с OpenFlow контроллером. Указанное устройство содержит один или более сетевых интерфейсов, блок приема информации, блок первоначальной идентификации потока, блок обработки инструкций, блок реализации действий, блок обработки групповых действий, блок межмодульного взаимодействия, блок взаимодействия с контроллером, средство обмена информацией между блоками; причем один или более сетевых интерфейсов соединены с блоком приема информации, выход блока приема информации подключен к входу блока первоначальной идентификации потока, а вход блока приема информации подключен к выходу блока междумодульного взаимодействия, вход которого подключен к выходу блока обработки инструкций, при этом блок обработки инструкций соединен с блоком первоначальной идентификацией потока, а блок идентификации потока, в свою очередь, соединен с блоком междумодульного взаимодействия. Все перечисленные элементы находятся в едином конструктивном исполнении. 5 з.п. ф-лы, 3 ил.
Наверх