Способ расширения физической области действия сети infiniband



Способ расширения физической области действия сети infiniband
Способ расширения физической области действия сети infiniband
Способ расширения физической области действия сети infiniband
Способ расширения физической области действия сети infiniband
Способ расширения физической области действия сети infiniband
Способ расширения физической области действия сети infiniband

 


Владельцы патента RU 2461140:

ОБСИДИАН РИСЕРЧ КОРПОРЭЙШН (CA)

Изобретение относится к технике связи и может использоваться для расширения физической области действия сети InfiniBand. Технический результат состоит в обеспечении контроля над большей частью сети и эффективного перемещения больших объемов данных на большие расстояния, используя единый транспортный поток. Для этого сеть InfiniBand соединяют с соединением дальней связи (например, WAN) при поддержании скоростей полной 10 Gbit InfiniBand и сохранении семантики, указанной согласно архитектуре InfiniBand (IBTA). Система может включать в себя интерфейс InfiniBand, блок административного управления, маршрутизацию пакетов, инкапсуляцию/деинкапсуляцию, буферное запоминающее устройство большой емкости и интерфейс, логику и схемы WAN. 3 н. и 34 з.п. ф-лы, 6 ил.

 

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Настоящее изобретение относится к устройству, предназначенному для расширения физической области действия сети InfiniBand выше таковой, возможной в настоящее время в рамках архитектуры InfiniBand, и в частности, позволяет, чтобы пакеты InfiniBand транспортировались по сетям, которые сами не являются совместимыми с архитектурой InfiniBand. Это дает возможность трафику InfiniBand совместно использовать физическую сеть с другими стандартными протоколами, такими как протокол Internet (протокол IP) версии 6 (IPv6) или протокол ячеек с поддержкой режима (РАП, ATM) асинхронной передачи. Дополнительно, вследствие наличия в устройстве очень большого буфера управления потоком данных, вместе с использованием схемы разрешений на передачу для управления потоком данных, чтобы предотвращать переполнение буфера, изобретение дает возможность, чтобы большой объем данных передавался в рамках глобальной сети (ГВС, WAN) связи, к тому же обеспечивая при этом, что не будут потеряны пакеты вследствие недостаточных ресурсов буферизации в приемнике. Чтобы способствовать гарантии, что пакеты не терялись внутри WAN, устройство может также включать в себя ряд функций поддержки качества обслуживания (QOS), которые используются, чтобы ограничивать скорость передачи («нагнетания») данных в WAN в ответ на передачу в обратном направлении (противодавление). Изобретение может также предоставлять возможность, чтобы пакеты были маршрутизированы таким образом, чтобы предоставлять возможность нескольким устройствам соединяться с WAN, разрешая таким образом, чтобы сеть InfiniBand расширялась более чем на 2 физических местоположения, используя минимальное количество оборудования. Процессор, содержащийся в устройстве, может вести функции административного управления, такие как функции агента управления подсетью InfiniBand и управления устройством.

ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ

Известно, что сеть 10 Gbit InfiniBand (имеющая скорость 10Гбит/с) способна иметь дальность действия приблизительно только 10 км вследствие ограничения в пределах архитектуры InfiniBand для большей части 128 KiB предоставленных разрешений на передачу на один виртуальный канал (VL). Это ограничение накладывает верхний предел на количество данных, которые могут передаваться за один раз, поскольку стандартный передатчик InfiniBand не будет осуществлять передачу без имеющегося в наличии разрешения на передачу. Дополнительно, известно, что ограничение количества данных, которые могут передаваться, значением меньше результирующего значения времени ожидания пропускной способности сетевого тракта, будет непосредственно ограничивать максимальную скорость передачи данных, которая может достигаться.

Например, линия связи сети 10 Gbit InfiniBand с временем задержки прохождения сигнала в прямом и обратном направлении в 130 микросекунд, имеет значение ожидания пропускной способности в 128 KiB, являющимся максимальным количеством разрешений на передачу пакета, которые можно предоставлять для отдельного VL в рамках линии связи InfiniBand.

Обычно линия связи InfiniBand будет иметь несколько входных и выходных VL (до 15), которые, как определяет архитектура InfiniBand, должны быть каждый независимо буферизуемым и управляемым по потоку, чтобы предотвращать блокировку головного пакета и тупиковую ситуацию в управлении потоком. В некоторых вариантах осуществления интерфейс InfiniBand содержит дополнительные блоки буферизации управления потоком для перехода от области тактовых сигналов (синхросигналов) WAN к области тактовых сигналов InfiniBand.

Вследствие физических ограничений данные перемещаются со скоростью, меньшей, чем скорость света по светопроводу. Когда светопровод рассматривается в качестве канала, который переносит биты, ясно, что одиночный кусок длинного светопровода может содержать многие мегабиты данных, которые являются передаваемыми. Например, если скоростью распространения света в конкретном светопроводе, переносящем 10-Гигабитовый поток данных, является 5 нс/м, и светопровод имеет длину 100 км, то светопровод будет содержать 5 мегабит данных в каждом направлении. Многие тракты WAN также включают в себя добавленное время задержки от внутреннего оборудования (сети), такого как оборудование регенерации, мультиплексоры оптического носителя, мультиплексоры ввода-вывода, маршрутизаторы, коммутаторы и так далее. Это дополнительное оборудование добавляет дополнительную задержку и дополнительно увеличивает значение задержки пропускной способности тракта передачи.

Как определено согласно архитектуре InfiniBand, InfiniBand-протоколы электрической и оптической сигнализации не являются совместимыми с традиционной средой WAN или подходящими для использования в ней. Типичные среды WAN используют стандарт синхронной оптической сети связи (SONET) по светопроводу для дальней связи.

Также, чтобы упростить администрирование сети InfiniBand, является желательным выполнять маршрутизацию для InfiniBand-пакетов, как описано в архитектуре InfiniBand. Маршрутизация позволяет каждому удаленному дальнему узлу поддерживать локальный контроль над своей частью большей сети InfiniBand без наложения существенной политики на всех остальных участников.

КРАТКОЕ ОПИСАНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯ

Если рассматривать вместе, физические ограничения светопровода, необходимость иметь емкость буферизации выше таковой для результирующей задержки в пропускной способности тракта, и характеристику многих VL в рамках архитектуры InfiniBand, становится очевидным, что требуется устройство с хорошоуправляемым сверхбольшим буферным запоминающим устройством, чтобы расширять сеть InfiniBand до трансконтинентальной дальности. Например, физическое расстояние 5000 км с 15-ю VL будет требовать буферного запоминающего устройства в 894 MiB без рассмотрения каких-либо дополнительных потерь из-за задержки.

Часть функционирования устройства предназначена для расширения разрешения на передачу, извещаемого по локальной короткой линии связи InfiniBand, которая обычно составляет 8 KiB, до числа, более подходящего для WAN, обычно 512 MiB на один VL. Это выполняется, используя буфер (FIFO) обратного магазинного типа («первым пришел - первым обслужен»), который опустошается, когда являются доступными разрешения на передачу локальной InfiniBand, и наполняется, если поступают входящие данные. Периодически устройство уведомляет другое удаленное устройство, какой объем доступен внутри FIFO, посредством пакета извещения о разрешении на передачу для каждого активного VL, и удаленное устройство использует эту информацию, чтобы обеспечить, что оно никогда не передает большее количество данных, чем FIFO может принять. Это является таким же базовым механизмом управления потоком (сквозной обмен информацией о разрешении на передачу пакета), который используется с архитектурой InfiniBand, но он увеличен, чтобы управлять гигабайтами буфера и чтобы быть более подходящим для среды WAN. Таким образом, семантика управления потоком по методике InfiniBand поддерживается на значительных расстояниях, обеспечивая, что пакеты не отвергаются вследствие перегруженности.

В другом варианте осуществления буферное запоминающее устройство большого объема может выбирать пакеты из множества структур FIFO в порядке, отличающемся от порядка, в котором пакеты были приняты.

Если на порте локальной InfiniBand имеется недостаточность разрешений на передачу, то будет заполняться FIFO, но вследствие посланных по WAN разрешений на передачу пакета, передатчик будет останавливать посылку прежде чем FIFO может переполниться. Пакеты разрешения на передачу могут быть вставлены в IPv6-структуры полезной нагрузки (полезных данных), или в качестве альтернативы, они могут быть вложены в IPv6-заголовки расширения для повышенной эффективности.

Информация разрешения на передачу или данные кодируются в виде упорядоченных наборов в коде 66/64b. InfiniBand-пакеты могут быть помещены внутри структур полезных данных в дейтаграммах UDP (протокол передачи дейтаграмм пользователя) или DCCP (процедура управления передачей данных), транспортируемых в пакетах протоколов IPv6 или IPv4.

Чтобы достичь совместимости со стандартами WAN, InfiniBand-пакеты для передачи по WAN инкапсулируются (оформляются в пакет) устройством в рамках других протоколов, например, IPv6 в рамках пакета по SONET (POS) (передача пакетов по сети SONET). Как сформулировано в IBTA, полнодуплексный независимый тракт передачи и приема данных является управляемым посредством конечного автомата линии связи. Конечный автомат физической линии связи InfiniBand может быть поддержан путем обмена не являющимися InfiniBand пакетами через WAN; причем выполнение этого устанавливает, что в WAN существует сквозной тракт передачи, этот обмен пакетов содержит обмены пакетами по протоколам PPP (канал связи с непосредственным соединением «точка-точка») LCP (протокол управления каналом) (согласно рабочим предложениям RFC 1661), обмены по сетевому протоколу ARP Ethernet (согласно рабочим предложениям RFC 826 и RFC 2461 (обнаружение соседнего по IPv6)), инициализации сеанса по протоколу TCP (согласно рабочим предложениям RFC 793), установления коммутируемых виртуальных каналов (SVC) по протоколу ATM (согласно техническим условиям сетевого интерфейса частных сетей Форума ATM (ассоциация производителей и пользователей)), или любую другую форму инициирования сеанса.

После инкапсуляции пакеты передаются по WAN, и приемное устройство выполняет этап деинкапсуляции (восстановления), удаляя данные, добавленные в течение инкапсуляции, восстанавливая посредством этого исходный InfiniBand-пакет.

Такая инкапсуляция пакета используется для двух целей: первой является изменение формата передачи оптических сигналов на тот, который может быть внутренне переносимым по соединению WAN, например, SONET. Это позволяет, чтобы устройство было непосредственно соединенным с оптическим оборудованием SONET, которое является частью более большой топологии SONET, и было переносимым через нее на одиночный удаленный пункт назначения. Протоколы SONET, например общий протокол (GFP) формирования кадров, разработаны для данного вида задачи инкапсуляции. Компонент инкапсуляции способен поддерживать множество сетей, включающих в себя любую с протоколом из IPv6, UDP в IPv6, DCCP в IPv6, ATM AAL5 или GFP.

Это также позволяет устройству осуществлять сопряжение с интеллектуальным оборудованием в рамках WAN, которое может осуществлять маршрутизацию отдельных пакетов или ячеек. Это также позволяет, чтобы трафик InfiniBand совместно использовал инфраструктуру WAN вместе с трафиком от других источников, основываясь на WAN для выполнения агрегации, маршрутизации и/или коммутации многих соединений.

Протоколы, такие как протокол адаптации ATM уровня 5 (AAL5), IPv6 поверх POS и IPv6 поверх Ethernet, разработаны, чтобы учитывать это.

С целями установления и поддержания сквозного тракта передачи через WAN для осуществляющего связь устройства является необходимым обмениваться не являющимися InfiniBand-пакетами в дополнение к инкапсулированным InfiniBand-пакетам.

Согласно устройству возможны многие инкапсуляции, включая в них ATM AAL5, IPv6 поверх POS, IPv6 поверх Ethernet, DCCP в IPv6, UDP в IPv6, IPv6 поверх общей многопротокольной коммутации с помощью меток (GMPLS), GFP и другие. Подобным образом могут быть поддержаны многие стандарты WAN по сигнализации и скоростям, включая SONET, Ethernet LAN-PHY (уровень физического устройства ЛВС) и Ethernet WAN-PHY (уровень физического устройства ГВС). Отдельное устройство может поддерживать многие стандарты инкапсуляции и сигнализации, и пользователь может выбирать, какой использовать в течение установки (инсталляции).

Для более коротких расстояний, менее 10 км, от инкапсуляции пакета воздерживаются, и просто используется оптическая сигнализация, которая определена согласно архитектуре InfiniBand, в комбинации с очень большим буфером для управления потоком, чтобы расширять дальность действия обычного оборудования InfiniBand при полном соответствии архитектуре InfiniBand. В этом случае процесс инкапсуляции сводится к пустой инкапсуляции и выдает InfiniBand-пакеты неизмененными. Количество блоков разрешения на передачу и/или размер блока разрешения на передачу может быть увеличено, чтобы расширить диапазон свыше 10 км, к тому же при соблюдении в остальном неизмененный протокол связи InfiniBand.

Множество устройств. Когда устройство соединено с интеллектуальной WAN с использованием протокола инкапсуляции, который способен осуществлять адресацию, возможно иметь более двух взаимодействующих устройств. Это позволяет устройствам, расположенным на многих физических узлах, совместно использовать одно и то же WAN-соединение и одно и то же устройство, при этом расширяя и связывая свои InfiniBand-сети в большую сеть.

В таком режиме работы требуется устройство, чтобы исследовать каждый входящий пакет локальной InfiniBand для определения, на какое удаленное устройство он должен быть послан, и затем сформировать надлежащую инкапсуляцию пакета, чтобы доставить его. Это может быть выполнено путем рассмотрения локального идентификатора (LID) внутри InfiniBand-пакета и использования инфраструктуры коммутации, определенной техническими условиями InfiniBand, или путем рассмотрения глобального идентификатора (GID) внутри InfiniBand-пакета и маршрутизации на основании соответствия самого длинного префикса для префикса подсети.

Каждое устройство также должно резервировать отдельную часть своего буфера управления потоком для каждого возможного удаленного устройства. Это дополнительно повышает требования к буферному запоминающему устройству в N-1 раз, где N является количеством устройств в сети.

Когда принимают многоадресные InfiniBand-пакеты, устройство или отобразит (преобразует) их на подходящий групповой WAN-адрес, или выполнит тиражирование пакета, чтобы послать многие копии пакета на каждое удаленное устройство, которое подписано на многоадресную группу.

Как определено согласно архитектуре InfiniBand версии 1.2, операция InfiniBand-маршрутизации требует, чтобы устройство преобразовало 128 битов GID по IPv6 в описание пути локальной InfiniBand, 16-битовый локальный идентификатор (LID), 24-битовый ключ раздела и 4-битовый уровень обслуживания для передачи в локальной сети InfiniBand, используя заголовок (GRH) глобального канала.

Когда устройство используется в интеллектуальной сети, а не в конфигурации "точка-точка", становится важным вопрос качества обслуживания внутри интеллектуальной сети. Устройство обеспечивает только то, что InfiniBand-пакеты не будут потеряны вследствие недостаточной буферизации, оно не обеспечивает какую-либо гарантию, что интеллектуальная сеть не будет отбрасывать пакеты вследствие внутренней перегруженности или иного.

Первым средством свести к минимуму потерю пакетов внутри сети является регулирование посредством устройства скорости подачи устройством пакетов в сеть. Устройство выполняет это путем вставки задержек между пакетами, если их посылают в WAN на приемный блок.

Скорость подачи может быть либо установлена пользователем, либо регулироваться динамически посредством взаимодействий и протоколов между устройством и интеллектуальной сетью. Имеются многие протоколы и способы для этого вида динамического регулирования.

Второй подход предназначен для устройства, чтобы особо пометить пакеты так, чтобы интеллектуальная сеть могла свести к минимуму потери. Этот подход может использоваться вместе с управлением скоростью подачи.

Программное обеспечение административного управления в рамках блока управления в составе устройства является ответственным за исполнение любых протоколов и способов, которые могут быть необходимыми, чтобы установить гарантии качества обслуживания по сети WAN, используя универсальный процессор.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Фиг.1A-3B - схемы потока данных, которые показывают каналы, по которым пакеты могут передаваться внутри системы. Каждый прямоугольник с квадратными углами представляет буфер, трансформационный процесс или точку принятия решения. Большие со скругленными углами прямоугольники представляют связанные группы функций. Стрелки показывают направление потока пакетов.

Фиг.1A и 1B - схема потока данных для представляющего прототип устройства. Схема показывает основные блоки для одного варианта осуществления изобретения.

Фиг.2A и 2B - схема потока данных для конкретной реализации дальнего действия, разработанной, чтобы осуществлять взаимодействие с большим количеством стандартов сигнализации и протоколов WAN. Многие из функциональных блоков она использует совместно с представленными в общих чертах на Фиг.1A и 1B.

Фиг.3A и 3B - схема потока данных для конкретной реализации ближней связи с сокращенными возможностями, которая иллюстрирует, как архитектура InfiniBand может использоваться в качестве протокола WAN.

ПОДРОБНОЕ ОПИСАНИЕ ПРЕДПОЧТИТЕЛЬНОГО ВАРИАНТА ОСУЩЕСТВЛЕНИЯ

Специалист в данной области техники признает, что различные стандарты и ресурсы присущи традиционному представлению цифровых данных. Некоторые стандарты и принципы действия, упомянутые в описании в качестве известных в области техники, могут быть найдены с помощью ссылки на:

- ассоциацию производителей по InfiniBand (2005). Архитектура InfiniBand версии 1.2 (известная также как "IBTA");

- комитет (IETF) по инженерным вопросам Интернет (1998). RFC 2460 - техническое описание Internet-протокола, версия 6 (IPv6);

- комитет по инженерным вопросам Internet (1998). RFC 2615 - PPP поверх SONET/SDH (синхронная цифровая иерархия, СЦИ);

- Форум ATM (1994). Техническое описание интерфейса ATM "пользователь-сеть", версия 3.1;

- Международный союз (МСЭ, ITU) электросвязи. Рекомендации сектора телекоммуникаций ITU 1.432.1. Общие характеристики;

- Взаимодействие (OSI) открытых систем - Базовая эталонная модель: Базовая модель (1994). ISO (Международная организация по стандартизации, ИСО) 7498-1:1994;

- IEEE 802.3ae (стандарт Института (ИИЭР) инженеров по электротехнике и радиоэлектронике на 10Gigabit Ethernet) пункт 49; схема кодирования 66/64b.

Со ссылкой на Фиг.1A и 1B описывается поток данных в пределах представляющего прототип устройства. Устройство содержит шесть основных блоков: интерфейс InfiniBand, блок управления, блок маршрутизации пакета, компонент инкапсуляции/деинкапсуляции (ENCAP), WAN-интерфейс и буферное запоминающее устройство большого объема. Имеются различные способы и технологии, которые могут использоваться, чтобы реализовать каждый из этих блоков. Эти блоки в схеме потока данных идентифицированы в виде логических функций, конкретные реализации могут избрать распределение (распространение) этих логические функции между различных физических блоков, чтобы достичь наилучшего осуществления. Устройство может поддерживать для InfiniBand-пакетов скорости передачи приблизительно в 1 гигабайт в секунду одновременно в каждом направлении.

Интерфейс InfiniBand обеспечивает соединение LAN с сетью коммутации локальной IB. Для ясности интерфейс InfiniBand включает в себя два небольших буфера управления потоком, чтобы согласовать скорости передачи данных от других присоединенных блоков.

Блок управления обеспечивает реализацию различных высокоуровневых протоколов административного управления и регулирования, требуемых различными стандартами, которые устройство может соблюдать; например, агента управления подсетью IB, реализацию протокола «точка-точка» (PPP) для пакета поверх SONET, работы и обслуживания (OAM) ATM-ячеек и кэширования/запросов обнаружения соседних для Ethernet. Обычно этот блок реализован с использованием универсального микропроцессора некоторого вида, объединенного со специализированной логикой для каких-либо пакетов управления с низкой задержкой или высокой частотой, например некоторых видов ячеек OAM.

Блок маршрутизации пакета осуществляет функциональность, требуемую в соответствии с InfiniBand-маршрутизацией многоэлементного устройства и описанными выше возможностями качества обслуживания (QOS). Он также обеспечивает WAN-пакеты разрешения на передачу, как обсуждено в контексте расширения дальности. Блок маршрутизации пакета также способен идентифицировать пакеты, которые должны быть доставлены на блок управления для специальной обработки.

Блок инкапсуляции/деинкапсуляции осуществляет процесс инкапсуляция пакета, описанный в контексте вышеуказанной инкапсуляции протокола. В одном варианте осуществления, протоколом является 7-уровневая эталонная модель OSI (как определено в ISO 7498-1:1994) и выбирается из группы, состоящей из уровня 1 (физического), уровня 2 (канала передачи данных), уровня 3 (сетевого) и уровня 4 (транспортного).

Графическое представление прототипа показывает несколько возможных различных схем. Блок инкапсуляции пакета основывается на дополнительных данных от блока маршрутизации, чтобы определить точную форму инкапсуляции пакета. Деинкапсуляция пакета восстанавливает исходный IB-пакет из инкапсулированных данных. Некоторые пакеты могут быть маршрутизированы на блок управления и не посылаться через блок деинкапсуляции пакета, если они идентифицированы в качестве управляющих пакетов.

WAN-интерфейс является общим интерфейсом по отношению к WAN-порту. Как показано при этом, он включает в себя оптическую подсистему, но возможно, что WAN-интерфейсы используют передачу электрических сигналов. Блок-формирователь кадров или функция получают данные пакета от блока инкапсуляции и форматирует его, чтобы он соответствовал выбранному WAN-протоколу. Например, технические описания Ethernet будут относиться к блоку-формирователю кадров в виде комбинации контроллера доступа к среде передачи (MAC), подуровня (PCS) физического кодирования и присоединения (РМА) физической среды. Формирователь кадров также выполняет обратное действие (инверсию) и извлекает из WAN-интерфейса пакет, который должен быть передан на блок деинкапсуляции.

Поддерживаемые форматы формирования кадров включают в себя схемы кодирования SONET/SDH, 10GBASE-R, InfiniBand, 10GBASE-W и 66/64b, определенные согласно 1ЕЕЕ802.3ае, пункт 49-10GBASE-R.

Компонент ENCAP формирует в кадры IB-пакеты способом, совместимым со схемой кодирования 66/64b, определенной согласно 1ЕЕЕ802.3ае, пункт 49; при этом компонент ENCAP может удалять совместимое с пунктом 49 оформление кадра и восстанавливать исходный IB-пакет.

Буферное запоминающее устройство большого объема реализует блок управления разрешением на передачу в соответствии с описанием расширения дальности. Точная характеристика лежащей в основе памяти может изменяться в зависимости от реализации.

На Фиг.2 представлен поток данных в рамках предпочтительного варианта осуществления изобретения, предназначенного для конфигурации «дальнего действия». Это осуществление изобретения состоит из платы с печатной схемой (ПП, РСВ), которая содержит внутрикристальную систему, реализованную в рамках программируемой вентильной матрицы (FPGA), медный соединитель СХ4 с параметрами 4х InfiniBand, формирователь кадров/блок отображения SONET/Ethemet, 2 гнезда "буферизованного" синхронного динамического ОЗУ (SDRAM) с удвоенной скоростью обмена (DDR2), сетевую поисковую службу, элементы поддержки процессора административного управления и взаимозаменяемый оптический модуль WAN, который соответствует техническому описанию MSA-300.

FPGA обеспечивает уникальную функциональность устройства, тогда как остальные компоненты являются промышленными стандартными элементами. FPGA реализует четыре электрических интерфейса для основного тракта данных, интерфейс 2,5 Гбит 4х InfiniBand соединен с соединителем СХ4, микросхема DDR2 SDRAM на 266 МГц используется для буферов FIFO, интерфейс SPI-4.2 для соединения с формирователем кадров/блоком отображения и LA-1, соединенный с сетевой поисковой службой.

Буфер FIFO реализуется с использованием стандартной памяти DDR2 SDRAM. Посредством мультиплексирования с разделением времени доступа к памяти, чтобы обеспечить эффективное двухпортововое ОЗУ (RAM) с максимальной входной пропускной способностью свыше 10 Гбит/с, при одновременном поддержании выходной пропускной способности выше 10 Гбит/с. Это позволяет, чтобы для буфера FIFO использовалось недорогое серийное запоминающее устройство. Управляющая логика в рамках FPGA разделяет SDRAM на многие VL и использует шину памяти SDRAM, чтобы обеспечивать функциональность FIFO.

Доступ к WAN обеспечивается с использованием компонентов, которые следуют техническим описаниям, определенным Форумом (OIF) по оптическому межсетевому обмену. Конкретно используется интерфейс SFI-4.1, чтобы соединять с оптическим модулем по соединителю, определенному согласно техническому описанию MSA-300. Этот же интерфейс также может быть преобразован оперативно («на лету») в интерфейс IEEE 802.3ае XSBI для использования с физическим устройством PHY LAN 10G Ethernet. Взаимозаменяемый модуль дает возможность устройству поддерживать SONET OC-192, PHY LAN 10G Ethernet и PHY LAN 10G Ethernet на нескольких видах световода с различными выходными мощностями и значениями чувствительности приемника в зависимости от требования пользователя и установленного оптического модуля.

Устройство может осуществлять обмен информацией непосредственно через оптическую WAN или косвенно через дополнительное стандартное сетевое оборудование, такое как мультиплексоры SONET/SDH, оптические регенераторы, маршрутизаторы пакетов и коммутаторы ячеек.

Интерфейс SFI-4.1/XSBI соединен с формирователем кадров/блоком отображения, который внутренне управляет аспектами низкоуровневого протокола сигнализации (функции MAC/PCS/PMA в терминах языка Ethernet). FPGA осуществляет обмен полными пакетами (или ячейками в случае ATM) с формирователем кадров/блоком отображения по интерфейсу SPI-4.2, которые формирователь кадров/блок отображения затем преобразовывает в требуемый протокол сигнализации WAN. Это преобразование управляется по стандартам, опубликованным Международным союзом электросвязи (ITU), комитетом (IETF) по инженерным вопросам Internet, Форумом ATM, Институтом (ИИЭР) инженеров по электротехнике и радиоэлектронике и Форумом (OIF) по оптическому межсетевому взаимодействию.

Конечным компонентом является соединенный с сетевой поисковой службой (NSE) LA-1. NSE используется в качестве части функциональной возможности маршрутизации InfiniBand, чтобы преобразовывать входящие IPv6-адреса в описания маршрута локальной InfiniBand. FPGA будет извлекать IPv6-пакет из пакета, поступающего от WAN, и передавать его на NSE, которая затем будет быстро осуществлять поиск внутренних таблиц, чтобы найти совпадение, и затем будет возвращать на FPGA связанные данные (совпадающий IB-маршрут). Если необходимо, процессор административного управления внутри FPGA будет обновлять таблицы NSE новыми данными, если они становятся доступными.

Второй вариант осуществления изобретения показан на Фиг.3A и 3B. Этот вариант осуществления является сниженной по издержкам версией того же, представляющего прототип устройства, показанного на Фиг.2A и 2B. Основная цель данного осуществления состоит в том, чтобы допустить расширение дальности до 10 км с использованием только 1x InfiniBand с учетверенной скоростью (QDR) передачи данных, как определено архитектурой InfiniBand.

Эта реализация состоит из FPGA, соединителя CX4, однокристальной QDR SRAM и оптического модуля XFP. FPGA непосредственно сопрягается и с (интерфейсом) 10Gbit 4x InfiniBand (локальным) и 10Gbit 1x InfiniBand (WAN).

Как в варианте осуществления для «дальнего действия», взаимозаменяемый модуль обеспечивает оптический WAN-интерфейс. Однако вместо интерфейса MSA-300, этот модуль соответствует техническому описанию XFP (как определено Группой XFP MSA) и взаимодействует непосредственно с FPGA по 10 Г-битной шине XFI. Это позволяет пользователю выбирать модуль XFP, который наилучшим образом подходит их локальной среде.

Буфер FIFO реализован с использованием QDR (или QDR2) SRAM, являющимся формами запоминающего устройства, которые оптимально предназначены для малого двупортового запоминающего устройства. Контроллер в FPGA разделяет запоминающее устройство на многие VL и управляет операциями буферов FIFO.

Варианты осуществления, для которого испрашивается исключительное право собственности или привилегия, определены ниже в формуле изобретения.

1. Способ транспортировки InfiniBand-пакетов по соединению дальней связи, содержащий этапы, на которых: принимают InfiniBand (IB) пакеты от посылающего IB интерфейса, инкапсулируют принятые IB-пакеты внутри протокола соединения дальней связи; передают инкапсулированные IB-пакеты по соединению (WAN) дальней связи посредством посылающего блока, причем WAN соединяет посылающий IB-интерфейс и принимающий IB-интерфейс; принимают инкапсулированные IB-пакеты на принимающем блоке, осуществляют деинкапсуляцию IB-пакетов путем удаления инкапсуляции и восстановления IB-пакетов на принимающем блоке; буферизуют принятые IB-пакеты в буферном запоминающем устройстве большого объема, которое превышает 128 килобайт,
регулируют поток IB-пакетов по WAN с помощью блока управления разрешениями на передачу, так что пакеты не отвергаются принимающим буферным запоминающим устройством большого объема из-за недостаточной емкости,
причем механизм сквозного обмена информацией о разрешении на передачу поддерживается по WAN и пакеты, не являющиеся IB-пакетами, обмениваются по WAN для увеличения дальности линии связи IB пo WAN до расстояния, большего, чем приблизительно 10 км.

2. Способ по п.1, в котором протоколом является эталонная 7-уровневая модель OSI и выбирается из группы, состоящей из уровня 1, уровня 2, уровня 3 и уровня 4.

3. Способ по п.1, в котором передача инкапсулированных IB-пакетов дополнительно содержит этап увеличения дальности линии связи IB по WAN до расстояний больше приблизительно 100 км.

4. Способ по п.3, в котором увеличение дальности линии связи дополнительно содержит этап увеличения разрешения на передачу IB-пакетов, извещаемого по линии связи, выше примерно 12 килобайт на одну виртуальную линию (VL).

5. Способ по п.4, в котором увеличение доступного разрешения на передачу содержит увеличение количества байтов на один извещаемый блок разрешения на передачу.

6. Способ по п.4, в котором увеличение доступного разрешения на передачу содержит увеличение количества блоков разрешения на передачу на одно извещение.

7. Способ по п.4, в котором увеличение доступного разрешения на передачу содержит увеличение как количества блоков разрешения на передачу, так и количества байтов на один блок в каждом извещении.

8. Способ по любому из пп.1-7, в котором этап поддержания управления потоком по методике IB содержит этап выбора блоком посылки выходной виртуальной линии (VL) в приемном блоке для деинкапсулированных IB-пакетов.

9. Способ по любому из пп.1-7, в котором этап поддержания конечного автомата физической линии связи InfiniBand дополнительно содержит этап обмена пакетами, не являющимися IB-пакетами, через WAN; причем выполнение этого устанавливает, что в WAN существует сквозной тракт, обмен пакетами выбирается из группы, состоящей из: пакетов РРР LCP, обменов Ethernet ARP, инициализаций сеанса TCP и установления связей SVC ATM.

10. Способ по любому из пп.1-7, в котором этап поддержания управления потоком по методике IB дополнительно содержит буферизацию пакетов, принятых в порте WAN, в буферное запоминающее устройство, которое превышает 128 килобайт.

11. Устройство транспортировки InfiniBand-пакетов, состоящее из логических схем, содержащее: интерфейс InfiniBand, соединенный с компонентом InfiniBand-маршрутизации и QOS (качества обслуживания), при этом тракт от InfiniBand блока InfiniBand-маршрутизации и QOS к WAN соединен с компонентом инкапсуляции/деинкапсуляции (ENCAP); тракт от IB компонента ENCAP к WAN соединен с интерфейсом WAN; тракт от WAN интерфейса WAN к IB соединен с компонентом ENCAP; тракт от WAN компонента ENCAP к IB соединен с буферным запоминающим устройством большого объема, которое превышает 128 килобайт для увеличения расстояния линии связи InfiniBand по WAN интерфейсу до расстояния, большего, чем приблизительно 10 км; буферное запоминающее устройство большого объема соединено с трактом от WAN к IB интерфейса InfiniBand; блок управления разрешениями на передачу формирует разрешения на передачу для WAN и формирует обратный поток на интерфейс InfiniBand; компонент ENCAP соединен с блоком управления разрешением на передачу, чтобы осуществлять инкапсуляцию и деинкапсуляцию информации разрешения на передачу; и блок управления обеспечивает услуги агента управления подсетью InfiniBand, согласования и управления сквозной передачей WAN.

12. Устройство по п.11, в котором устройство может поддерживать скорости передачи приблизительно 1 гигабайт в секунду для InfiniBand-пакетов одновременно в каждом направлении.

13. Устройство по п.11, в котором интерфейс InfiniBand содержит дополнительные блоки буферизации управления потоком для перехода от области тактовых сигналов WAN к области тактовых сигналов InfiniBand.

14. Устройство по п.11, в котором компонент ENCAP способен поддерживать множество сетей, включающих в себя любую из: с протоколом " IPv6 (Интернет-протокола версии 6), UDP (протокол передачи дейтаграмм пользователя) в IPv6, DCCP (процедура управления передачей данных) в IPv6, ATM (режима асинхронной передачи) AAL5 (протокола адаптации ATM уровня 5) или GFP (общий протокол формирования кадров).

15. Устройство по п.11, в котором интерфейс WAN дополнительно содержит: блок-формирователь кадров, способный поддерживать множество сетевых форматов, включающих в себя любой из SONET/SDH (синхронной оптической сети связи/синхронной цифровой иерархии), 10GBASE-R, (архитектуры) InfiniBand, и 10GBASE-W; и оптическую подсистему, способную поддерживать любой из SONET/SDH, 10GBASE-R или InfiniBand.

16. Устройство по любому одному из пп.11-15, в котором буферное запоминающее устройство большого объема может принимать пакеты из множества структур FIFO в порядке, отличающемся от порядка, в котором пакеты были приняты.

17. Устройство по любому одному из пп.11-15, в котором блок управления разрешением на передачу извещает увеличенное количество разрешений на передачу посредством увеличения размера блока разрешения на передачу и/или увеличения количества блоков на одно извещение.

18. Устройство по любому одному из пп.11-15, в котором блок управления по п.11 реализован с использованием универсального процессора и подсоединен к средству для посылки и приема пакетов как по WAN, так и по IB-интерфейсам.

19. Устройство по любому одному из пп.11-15, в котором буферное запоминающее устройство большого объема дополнительно содержит:
множество модулей памяти (DIMM, модуль памяти с двухсторонним расположением микросхем) DDR2;
при этом логика управления поддерживает множество структур FIFO (первым пришел - первым ушел) внутри DDR2-памяти; и
при этом каждая структура FIFO используется для буферизации VL (виртуальной линии) от WAN к InfiniBand; и
при этом выдача пакетов из памяти является регулируемой, чтобы обеспечивать, что пакеты не отвергаются вследствие перегруженности на интерфейсе InfiniBand.

20. Устройство по п.11 для поддержания максимальной скорости передачи в 1 гигабайт в секунду для IB-пакетов одновременно в каждом направлении, дополнительно содержащее:
дополнительные блоки буферизации управления потоком для перехода от области тактовых сигналов WAN к области тактовых сигналов IB;
при этом компонент ENCAP способен поддерживать множество сетей, включающих в себя любую из: с протоколом IPv6 (Интернет-протокола версии 6), UDP (протокол передачи дейтаграмм пользователя) в IPv6, DCCP (процедура управления передачей данных) в IPv6, ATM (режима асинхронной передачи) AAL5 (протокола адаптации ATM уровня 5) или GFP (общий протокол формирования кадров); блок-формирователь кадров, способный поддерживать множество сетевых форматов, включающих в себя любой из SONET/SDH, 10GBASE-R, InfiniBand и 10GBASE-W;
оптическую подсистему, способную поддерживать любой стандарт из SONET/SDH, 10GBASE-R или InfiniBand,
при этом буферное запоминающее устройство большого объема может принимать пакеты из множества структур FIFO в порядке, отличающемся от порядка, в котором пакеты были приняты, и при этом буферное запоминающее устройство большого объема дополнительно содержит:
множество модулей (DIMM) DDR2-памяти;
при этом логика управления поддерживает множество структур FIFO внутри DDR2-памяти; и при этом каждая структура FIFO используется для буферизации VL от WAN к InfiniBand; и при этом выдача пакетов из памяти является регулируемой, чтобы обеспечивать, что пакеты не отвергаются вследствие перегруженности в интерфейсе InfiniBand,
при этом управление разрешением на передачу увеличивает количество разрешений на передачу посредством увеличения размера блока разрешения на передачу и/или увеличения количества блоков на одно извещение, при этом блок управления реализован с использованием универсального процессора, и
соединен со средством для посылки и приема пакетов как по WAN, так и по IB интерфейсам.

21. Устройство по п.20, в котором компонент ENCAP выполняет пустую инкапсуляцию и выдает неизмененные IB-пакеты.

22. Устройство по п.20, в котором буферное запоминающее устройство большого объема дополнительно содержит:
множество микросхем SRAM-памяти;
при этом логика управления поддерживает множество структур FIFO в микросхемах SRAM-памяти; и
при этом каждая структура FIFO используется для буферизации VL от WAN к InfiniBand; и
при этом выдаваемый из памяти пакет является регулируемым, чтобы обеспечивать, что пакеты не отвергаются вследствие перегруженности на интерфейсе InifiniBand.

23. Устройство по п.22, в котором микросхемы SRAM-памяти относятся к типу SRAM QDR2.

24. Устройство по п.20, в котором буферное запоминающее устройство большого объема содержит множество микросхем SRAM-памяти; и в котором логика управления поддерживает множество структур FIFO внутри микросхем SRAM-памяти; и в котором каждая структура FIFO используется для буферизации VL от WAN к InfiniBand; и при этом выдаваемый из памяти пакет является регулируемым, чтобы обеспечивать, что пакеты не отвергаются вследствие перегруженности на интерфейсе InfiniBand.

25. Устройство по п.24, в котором IB-пакеты помещены внутри структуры полезных данных IРv6-пакетов.

26. Устройство по п.25, в котором данные разрешения на передачу кодируют в заголовках расширения внутри IРv6-заголовка.

27. Устройство по любому одному из пп.11-15 или 20-26, в котором блок-формирователь кадров принимает IB-пакеты от блока инкапсуляции компонента ENCAP и форматирует их для согласования с протоколом соединения дальней связи; и
блок-формирователь кадров извлекает форматированный IB-пакет из WAN интерфейса для передачи на блок деинкапсуляции компонента ENCAP.

28. Устройство по любому одному из пп.11-15 или 20-26, в котором данные разрешения на передачу закодированы в виде упорядоченных наборов в коде 66/64b.

29. Устройство по п.28, в котором IB-пакеты помещены внутри структуры полезных данных для дейтаграмм UDP (протокол передачи дейтаграмм пользователя) или DCCP (процедура управления передачей данных), транспортируемых внутри пакетов протоколов IPv6 (Интернет-протокола версии 6) или IPv4 (Интернет-протокола версии 4).

30. Устройство по п.28, в котором IB-пакеты сегментированы на АТМ-ячейки в соответствии с протоколом адаптации ATM (AAL5) уровня 5.

31. Устройство по п.28, в котором IB-пакеты помещены внутри структуры полезных данных пакета согласно общему протоколу формирования кадров и помещены внутри кадра SONET/SDH.

32. Устройство по п.31, в котором данные разрешения на передачу кодированы внутри структуры полезных данных в составе оформления пакета.

33. Система для транспортировки InfiniBand-пакетов по соединению дальней связи, содержащая:
первую сеть коммутации InfiniBand, соединенную с первым устройством;
упомянутое первое устройство, соединенное со вторым устройством;
упомянутое второе устройство, соединенное со второй сетью коммутации InfiniBand;
при этом первое и второе устройства дополнительно содержат:
логическую схему для осуществления инкапсуляции и деинкапсуляции IB-пакетов в протокол соединения дальней связи; и логическую схему для буферизации IB-пакетов в буферном запоминающем устройстве большого объема, которое превышает 128 килобайт;
логическую схему для регулирования потока IB-пакетов по соединению дальней связи, большему, чем приблизительно 10 км, так что пакеты не отвергаются принимающим буферным запоминающим устройством большого объема из-за недостаточной емкости, и
сетевой интерфейс, который передает инкапсулированные InfiniBand-пакеты.

34. Система по п.33, в которой первое устройство и второе устройство дополнительно могут обмениваться по расширенной сети WAN через один или несколько мультиплексоров SONET/SDH, оптических регенераторов, маршрутизаторов пакетов и коммутаторов ячеек.

35. Система по п.33, в которой скорость потока пакетов в компоненте ENCAP может быть ограничена устройством на основании условий внутри сети или конфигурации администрирования до скорости меньшей или равной максимальной возможной скорости передачи.

36. Система по п.33, в которой система дополнительно содержит:
сеть с коммутацией или маршрутизацией пакетов или ячеек, существующую между этими двумя устройствами;
при этом с этой сетью могут быть соединены более двух устройств; и при этом каждое устройство может инкапсулировать и адресовать пакеты на несколько других устройств.

37. Система по любому из пп.33-36, в которой IB-сеть дополнительно содержит: две сети коммутации InfiniBand, имеющие разделенные адресные пространства логических идентификаторов (LID) и различные префиксы подсетей; компонент маршрутизации пакетов, встроенный в упомянутые устройства, при этом: логическая схема определяет LID-адрес заданного IB-пакета путем проверки целевого глобального идентификатора (GID) в глобальном заголовке маршрутизации (GRH); и при этом логическая схема может заменять LID, уровень услуги SL, виртуальную линию VL или другие компоненты IB-пакета, используя информацию из GRH.



 

Похожие патенты:

Изобретение относится к системе связи, в частности к системам передачи видеопотока в реальном режиме времени на значительное расстояние по радиоканалам связи, и может быть использовано в системах передачи и приема сжатых графических файлов.
Наверх