Модифицированный интеллектуальный контроллер с адаптивным критиком

Изобретение относится к интеллектуальному контроллеру с адаптивным критиком. Технический результат заключается в повышении адаптационных свойств системы управления на базе интеллектуального контроллера и повышении его быстродействия. Система содержит связанные между собой объект управления, блок критика, решающую нейронную сеть, блок действий, блок расчета подкрепления, блок расчета временной разности, блок выбора действия, блок отбора действий, блок обучения критика и блок занесения действий. 1 ил.

 

Изобретение относится к интеллектуальным контроллерам, использующим принцип обучения с подкреплением, нечеткую логику, и может использоваться для управления сложными системами в недетерминированной среде.

Известен интеллектуальный контроллер на основе сетей адаптивных критиков, например патент США: МПК G06F 15/18 5448681. Данное устройство состоит из объекта управления, сети критика и управляющей нейронной сети. Выход объекта управления связан с первым входом сети критики и первым входом управляющей нейронной сети, выход управляющей нейронной сети связан с входом объекта управления и вторым входом сети критики, выход сети критики связан со вторым входом управляющей нейронной сети.

Принцип работы устройства по патенту МПК G06F 15/18 5448681 следующий: объект управления выдает сигнал о своем состоянии, сеть критики вычисляет подкрепление для текущей временной итерации и состояния объекта, управляющая нейронная сеть вычисляет управляющее воздействие с учетом подкрепления.

Общий недостаток устройств на основе сетей адаптивных критиков состоит в том, что этот алгоритм не является обобщенным и достаточным для построения универсальной адаптивной системы управления объектом, действующим в недетерминированной среде, чтобы убедиться в этом, достаточно взглянуть на количество методов реализации и структур (DHP, HDP, ВАС, GDHP, FACL, GIFACL и другие). К недостаткам можно отнести, так как система должна управляться в режиме реального времени, большее количество вычислений. Также к недостаткам можно отнести то, что система управления, построенная на базе адаптивного критика, не может радикально менять свое поведение и вырабатывать новые реакции при абсолютно новых, неизвестных данных о состоянии окружающей среды и объекта управления (D. Prokhorov, D. Wanch. Adaptive critic designs. IEEE transactions on Neural Networks, September 1997, pp.997-1007).

Наиболее близким техническим решением является патент РФ МПК G06F 15/00 №2450336 «Модифицированный интеллектуальный контроллер с адаптивным критиком». Контроллер по данному патенту состоит из нескольких структурных компонент: объекта управления, блока действий, решающей нейронной сети, блока критика, блока расчета временной разности, блока расчета подкрепления, блока выбора действия. При этом объект управления связан по выходам состояния и действия с блоком действий, блоком прогнозирования параметра, блоком расчета временной разности и блоком расчета подкрепления. Выход блока действий связан со вторым входом блока критика, выход блока прогнозирования параметра связан с первым входом блока критика. Выход блока критика связан с входом блока выбора действия и входом блока расчета временной разности. Блок расчета временной разности соединен с входами и выходом критика. Блок расчета подкрепления соединен с блоком расчета временной разности. Выходы блока выбора действия соединены с входами блока действий и объектом управления.

Принцип работы устройства по патенту РФ МПК G06F 15/00 №2450336 следующий: объект управления выдает сигналы состояния и действия, по которым блок действий выбирает возможные действия в данной ситуации и подает их на блок критика параллельно с прогнозным значением рабочего параметра, который рассчитывает блок прогнозирования параметра. Критик, получая данные, последовательно оценивает последствия возможных действий и выдает их на блок выбора действия, который с помощью «жадного» - правила выбирает действие и подает его на исполнение в объект управления. Параллельно этому процессу, блок расчета подкрепления рассчитывает полученное подкрепление и подает его на блок расчета временной разности, который рассчитывает ошибку временной разности и если ошибка существенная, то блок расчета временной разности останавливает работу критика и переобучает его на новых данных.

Недостатками данного контроллера являются: недостаточные адаптационные свойства, сложность реализации блока критика и его обучения, ограниченные возможности работы блока выбора действий.

Задача - разработка модифицированного интеллектуального контроллера с адаптивным критиком.

Техническим результатом предлагаемого устройства является повышение адаптационных свойств системы управления на базе интеллектуального контроллера, повышение его скоростных характеристик и упрощение конечной реализации для разработчика.

Технический результат достигается тем, что в модифицированном интеллектуальном контроллере с адаптивным критиком, содержащем объект управления, блок критика, решающую нейронную сеть, блок действий, блок расчета подкрепления, блок расчета временной разности, блок выбора действия, первый и второй выходы объекта управления связаны с первым и вторым входами решающей нейронной сети, первым и вторым входами блока расчета временной разности, первым и вторым входами блока расчета подкрепления, выход решающей нейронной сети соединен с первым входом блока критика, выход блока критика связан с входом блока выбора действия, выход блока расчета подкрепления связан с третьим входом блока расчета временной разности, выход блока выбора действия соединен с входом объекта управления, введены блок отбора действий, блок обучения критика и блок занесения действий, при этом первый и второй выходы объекта управления также соединены с первым и вторым входами блока отбора действий, первый выход блока отбора действий соединен с первым входом блока действий, второй выход блока отбора действий соединен со вторым входом блока критика, третий выход блока отбора действий соединен с третьим входом решающей нейронной сети, четвертый выход блока отбора действий соединен со вторым входом блока выбора действия, выход блока действий соединен с третьим входом блока отбора действий, выход блока расчета подкрепления соединен также со вторым входом блока занесения действий, выход блока расчета временной разности соединен с первым входом блока обучения критика, первый и второй выходы блока обучения критика соединены соответственно с первым и вторым входами блока критика, третий выход блока обучения критика соединен с четвертым входом блока расчета временной разности, выход блока критика также соединен со вторым входом блока обучения критика, выход блока выбора действия также соединен с первым входом блока занесения действий, выход блока занесения действий соединен со вторым входом блока действий.

Задача повышения адаптационных свойств достигается за счет выделения процесса обучения нейронной сети блока критика в отдельной компоненте - блоке обучения критика. Другим важным моментом является то, что работа с блоком действий строится по новому принципу с использованием двух новых блоков - блока отбора действий и блоком занесения действий. Скоростные характеристики работы системы повышаются за счет блока отбора действий, который отсекает возможные действия не подходящие по минимальному заданному подкреплению. Упрощение реализации для разработчика заключается в декомпозиции блока действий на несколько блоков, а также в выделении процесса обучения нейронной сети блока критика в отдельном блоке.

Таким образом, совокупность существенных признаков, изложенных в формуле изобретения, позволяет достигнуть желаемого результата.

На фиг.1 изображена схема модифицированного интеллектуального контроллера с адаптивным критиком.

Система состоит из нескольких структурных компонент: блока расчета подкрепления 1, блока расчета временной разности 2, блока обучения критика 3, блока критика 4, решающей нейронной сети 5, блока выбора действия 6, блока отбора действий 7, блока действий 8, блока занесения действий 9, объекта управления 10.

Также в системе присутствуют следующие связи - от объекта управления идет сигнал состояния объекта 11, который соединен с входом блока отбора действий 11.1, решающей нейронной сети 11.2, блоком расчета подкрепления 11.3 и боком расчета временной разности 11.4. Также от объекта управления идет сигнал состояния внешней среды 12, который соединен с входами блока отбора действий 12.1, решающей нейронной сети 12.2, блоком расчета подкрепления 12.3 и блоком расчета временной разности 12.4. Выход блока действий соединен с блоком отбора действий по сигналу 13. От блока отбора действий идут сигналы на блок действий 14, решающую нейронную сеть 15, блока критика 16 и блок выбора действия 17. От решающей нейронной сети идет сигнал 18 на вход блока критика. Выходы блока обучения критика связаны с входами блока критика по сигналам 19 и 20, а выход блока критика 21 соединен с блоком обучения критика 21.1 и блоком выбора действия 21.2. От блока расчета временной разности идет сигнал 22 на блок обучения критика, также есть обратная связь от блока обучения критика к блоку расчета временной разности 23. Выход 24 блока расчета подкрепления соединен с входами: блока расчета временной разности 24.1 и блоком занесения действий 24.2. Выход 25 блока выбора действия соединен с входами объекта управления 25.1 и блока занесения действий 25.2. От блока занесения действий идет сигнал 26 на блок действий.

Блок расчета подкрепления 1 предназначен для расчета подкрепления r(t). Формула расчета подкрепления задается разработчиком.

Блок расчета временной разности 2 предназначен для расчета временной разности по формуле

δ(t)=r(t)+γ·V(t)-V(t-1),

где γ∈(0;1] - коэффициент забывания.

Блок обучения критика 3 предназначен для обучения/переобучения нейронной сети блока критика.

Блок критика 4 предназначен для расчета прогнозного значения качества ситуации V(t) последующей при выборе определенного действия. Для расчета качества ситуации используется послойно - полносвязная нейронная сеть прямого распространения сигнала (многослойный персептрон).

Решающая нейронная сеть 5 предназначена для прогнозирования следующего значения рабочего параметра системы (или нескольких параметров). Под рабочим параметром понимается тот параметр системы, оценивая который, система может определить, как она работает, либо это параметр, который служит ориентиром для работы системы (рабочих параметров может быть несколько).

Блок выбора действия 6 предназначен для выбора конкретного действия из всех возможных в данной ситуации. При выборе используется так называемое «ε - жадное правило» (Sutton R., Barto A. Reinforcement Learning: An Introducion. - Cambridge: MIT Press, 1998), которое можно записать как: «с вероятностью (1-е) выбирается то действие, которому соответствует максимальное значение качества ситуации , при этом 0<ε<<1».

Блок отбора действий 7 предназначен для отбора всех возможных действий в данной ситуации с учетом минимального накопленного подкрепления для возможного действия.

Блок действий 8 предназначен для хранения таблицы возможных действий во всех возможных ситуациях и накопленного подкрепления при совершении определенного действия в определенной ситуации.

Блок занесения действий 9 предназначен для внесения корректировок в блок действия 8. Данный блок обновляет значение накопленного подкрепления в ячейке выбранного действия на предыдущей итерации после отработки действия объектом управления.

Заявленное устройство работает следующим образом. Объект управления 10 выполняет действие и на выходах выдает сигналы состояния объекта 11 и внешней среды 12, которые поступают в блок отбора действий 7 по связям 11.1 и 12.1, по 11.2 и 12.2 в решающую нейронную сеть 5, по 11.3 и 12.3 в блок расчета подкрепления 1 и по 11.4 и 12.4 в блок расчета временной разности 2. При поступлении новых данных о состоянии объекта и внешней среды, блок отбора действий 7 запрашивает по связи 14 у блока действий 8 о возможных действиях в данной ситуации. При этом разработчиком при старте системы задается то минимальное значение совокупного полученного подкрепления, начиная с которого отбираются возможные действия в данной ситуации. Также задается количество итераций управления, при которых накапливается история полученного подкрепления в различных ситуациях при различных выполненных действиях (т.н. «этап исследования окружающей среды»). Получив обратно возможные действия в данной ситуации по связи 13, блок отбора действий 7 синхронно с блоком прогнозирования параметра 5 начинает подавать возможные действия на блок критика 4 по сигналу 16. Синхронизация решающей нейронной сети 5 и блока отбора действий 7 происходит по сигналу 15.

Решающая нейронная сеть 5, получив текущие значения состояния объекта управления 11.2 и внешней среды 12.2, вычисляет прогнозное значение рабочего параметра на следующую временную итерацию и подает вычисленное значение 18 на блок критика 4 совместно с сигналом 16 от блока отбора действий 7.

Блок критика 4, последовательно получая пары значений {возможное_действие; прогноз_рабочего_параметра}, прогнозирует возможное будущее подкрепление 21 при выполнении данного возможного действия.

Блок расчета подкрепления 1, получая значения текущего состояния внешней среды 12.3 и объекта управления 11.3, вычисляет по заданной формуле значение полученного подкрепления за последнюю отработанную итерацию управления. Полученное значение 24.1 рассчитанного подкрепления подается в блок расчета временной разности 2, который рассчитывает значение временной разности и формирует наборы {входы; выходы} для обучения нейронной сети блока критика 4. В случае, если ошибка временной разности велика, то есть выше заданного разработчиком предела, то блок расчета временной 2 запускает процесс переобучения нейронной сети блока критика 4, посылая сигнал 22 на блок обучения критика 3. Блок обучения критика 3 получает сигнал о старте переобучения нейронной сети блока критика 4 и начинает процесс переобучения нейросети блока критика. При этом активируются связи на входы 19 и 20 нейронной сети блока критика 4, тем самым блокируются поступления данных от блока отбора действий 7 и блока прогнозирования параметра 5. Блок обучения критика 3, пользуясь алгоритмом обратного распространения ошибки (см. подробнее Rumelhart D.E., Hinton G.E., Williams R.J., "Learning representations by back-propagating errors," Nature, vol.323, pp.533-536, 1986) обучает нейронную сеть блока критика 4. При этом примеры выбираются случайным образом, запрос на новый пример идет по связи 23, соответственно возврат номера примера для обучения идет по связи 22. Входы выбранного примера подаются на входы 19 и 20 нейронной сети блока критика 4, затем снимается значение выхода 21.1 нейронной сети блока критика 4 и сравнивается с выходом обучающего примера. Если ошибка выше заданной разработчиком, то формируется следующий обучающий пример и т.д.

После того как нейронная сеть блока критика 4 обучилась, входы 19 и 20 на блок критика 4 деактивируются и на него начинают поступать сигналы 16 и 18 от блока отбора действий 7 и решающей нейронной сети 5 и блок критика 4 начинает работать в обычном режиме, то есть рассчитывает возможное подкрепление для каждого возможного действия. Рассчитанное подкрепление для каждого возможного действия поступает на блок выбора действия 6, который, пользуясь т.н. «жадным правилом», выбирает действие и подает его на объект управления 10 по сигналу 25.1 и блок занесения действий 9 по сигналу 25.2. Блок занесения действий 9 обновляет по сигналу 26 значение определенной ячейки в блоке действий 8. То есть, если на (i-1) итерации в ситуации Si-1 управления было выбрано К-е действие, оно было отработано объектом управления и было получено подкрепление ri-1 (возможно отрицательное), которое и заносится в ячейку К-го действия в Si-1 ситуации. Таким образом, блок занесения действий 9 задерживает на такт выбранное действие 25.2 и обновляет совокупное накопленное подкрепление данного действия в соответствующей ситуации после того, как был получен результат работы в виде подкрепления.

Принцип работы блока действий 8 следующий. Блок действий 8 представляет собой четверки значений, которые можно реализовать в виде матрицы. Четверка значений следующая {Состояние внешней среды, Состояние объекта управления. Накопленный коэффициент эффективности, Возможное действие}. Соответственно блок отбора действий 7 выбирает те действия, которые проходят по критерию минимально заданного накопленного подкрепления, а блок занесения действий 9 обновляет значение накопленного коэффициента эффективности для выбранного действия в определенном состоянии внешней среды и объекта управления.

Модифицированный интеллектуальный контроллер с адаптивным критиком, содержащий объект управления, блок критика, решающую нейронную сеть, блок действий, блок расчета подкрепления, блок расчета временной разности, блок выбора действия, первый и второй выходы объекта управления связаны с первым и вторым входами решающей нейронной сети, первым и вторым входами блока расчета временной разности, первым и вторым входами блока расчета подкрепления, выход решающей нейронной сети соединен с первым входом блока критика, выход блока критика связан с входом блока выбора действия, выход блока расчета подкрепления связан с третьим входом блока расчета временной разности, выход блока выбора действия соединен с входом объекта управления, отличающийся тем, что в него введены блок отбора действий, блок обучения критика и блок занесения действий, при этом первый и второй выходы объекта управления также соединены с первым и вторым входами блока отбора действий, первый выход блока отбора действий соединен с первым входом блока действий, второй выход блока отбора действий соединен со вторым входом блока критика, третий выход блока отбора действий соединен с третьим входом решающей нейронной сети, четвертый выход блока отбора действий соединен со вторым входом блока выбора действия, выход блока действий соединен с третьим входом блока отбора действий, выход блока расчета подкрепления соединен также со вторым входом блока занесения действий, выход блока расчета временной разности соединен с первым входом блока обучения критика, первый и второй выходы блока обучения критика соединены соответственно с первым и вторым входами блока критика, третий выход блока обучения критика соединен с четвертым входом блока расчета временной разности, выход блока критика также соединен со вторым входом блока обучения критика, выход блока выбора действия также соединен с первым входом блока занесения действий, выход блока занесения действий соединен со вторым входом блока действий.



 

Похожие патенты:

Изобретение относится к автоматике и вычислительной технике. Техническим результатом является повышение точности при моделировании процесса принятия решения в условиях неопределенности.

Изобретение относится к интеллектуальным контроллерам, использующим принцип обучения с подкреплением и нечеткую логику, и может быть использовано для создания систем управления объектами, работающими в недетерминированной среде.

Изобретение относится к видеоанализу и к анализу и изучению поведения на основе данных потокового видео. .

Изобретение относится к области вычислительной техники и может использоваться для обработки сигналов систем искусственного интеллекта, в вычислительных машинах, решающих комбинаторные задачи перебора сочетаний.

Изобретение относится к классу интеллектуальных контроллеров и может быть использовано для создания систем управления объектами, работающими в недетерминированной среде.

Изобретение относится к интеллектуальным контроллерам, использующим принцип обучения с подкреплением, и может использоваться для управления сложными системами в недетерминированной среде.

Изобретение относится к соединению устройств ввода-вывода или устройств центрального процессора или передаче информации или других сигналов между этими устройствами.

Изобретение относится к вычислительной технике и может быть использовано в операционных системах для автоматического добавления программных компонентов в системные процессы.

Изобретение относится к способу оптимизации регулируемых параметров машины. .

Изобретение относится к классу интеллектуальных контроллеров, использующих принцип обучения с подкреплением, фильтр Калмана, и может использоваться для создания систем управления объектами, работающими в недетерминированной среде. Технический результат заключается в повышении скоростных и адаптационных параметров работы за счет введения в устройство блока корректировки фильтра Калмана. Технический результат достигается благодаря модифицированному интеллектуальному контроллеру, который содержит объект управления, решатель, блок расчета подкрепления, блок корректировки фильтра Калмана, блок действий, блок выбора действий, блок отбора действий, фильтр Калмана, память фильтра Калмана и блок занесения действий. 1 ил.

Изобретение относится к области адаптивного дистанционного обслуживания подвижных составов с помощью машинного обучения правилам. Техническим результатом является обеспечение автоматического обновления правил, применяемых для группировки диагностической информации, для более точной группировки диагностической информации. Правила могут заменяться, обобщаться или иным образом адаптироваться на основе взаимодействия диспетчеров с результатами действующих правил. Принятие или исключение события диспетчером используются в качестве наземного контроля данных для управляемого машинного обучения новому правилу. При машинном обучении используется обратная связь с пользователем для обновления набора правил. 3 н. и 17 з.п. ф-лы, 2 ил.

Изобретение относится к сетевым вычислительным системам. Техническим результатом является повышение эффективности обработки данных за счет использования обучающих данных. Система, содержит: первый клиентский компьютер, который содержит: запоминающее устройство, обеспечивающее хранение N генов, каждый из которых характеризуется множеством условий и по меньшей мере одним действием, причем N - целое число, превышающее 1; коммуникационный порт, через который первый клиентский компьютер периодически принимает данные, связанные с "N генами; и процессор, обеспечивающий оценку характеристики эффективности каждого из N генов путем сравнения решения, обеспечиваемого каждым геном, с периодически получаемыми данными, связанными с этим геном, причем характеристика эффективности каждого гена корректируется каждый раз при получении данных и определяет приспособленность гена. 4 н. и 25 з.п. ф-лы, 5 ил.

Изобретение относится к области радиотехники и может быть использовано для интеллектуального анализа оценки устойчивости инфокоммуникационной системы. Техническим результатом является повышение устойчивости функционирования системы связи при воздействии деструктивных электромагнитных излучений на ее структурные элементы за счет оперативной реконфигурации и обработки характера деструктивных воздействий. Систему связи приводят в рабочее состояние, фиксируют деструктивные воздействия на ее структурные элементы, формируют имитационную модель системы связи, моделируют на ней деструктивные воздействия, по результатам моделирования реконфигурируют имитационную модель системы связи и представляют математическую модель функционирования системы, определяют параметры электромагнитных полей, воздействующих на подсистемы инфрокоммуникационной системы, и осуществляют оценку воздействия этих электромагнитных полей на работоспособность отдельных элементов и узлов системы, а также системы в целом, формируют сценарии электромагнитных воздействий на узлы инфокоммуникационной системы, учитывая модели электромагнитных излучений во всем диапазоне частот, проводят анализ информационного потока, обрабатываемого инфокоммуникационными узлами, и выявляют закономерности появления искаженных пакетов информации, периодичность и кратность частоты появления которых определяют на частоте формирования импульсов известными источниками электромагнитного излучения, при обнаружении факта воздействия известных источников электромагнитных излучений блокируют искаженную информацию и реконфигурируют систему, проводят сравнительный анализ соответствия данных требованиям используемого телекоммуникационного протокола, дополнительно проводят анализ сценариев поведения инфокоммуникационной системы при действии на ее элементы и узлы электромагнитных воздействий, с учетом моделей электромагнитного излучения на всем диапазоне частот, осуществляют расчет целевых показателей, характеризующих устойчивость системы в целом и его отдельных подсистем к воздействию электромагнитных излучений. 1 ил.

Изобретение относится к области автоматики и вычислительной техники и может быть использовано для контроля и технической диагностики сложного технологического оборудования, в том числе - станочного оборудования и гибких производственных систем. Техническим результатом является обеспечение автоматического выбора значимых параметров из всего множества входных и выходных параметров за счет дополнительного обучения нейронной сети в процессе работы, за счет увеличения-уменьшения количества активных нейронов, не приводящего к ухудшению качества технической диагностики, а также за счет выбора избыточных нейронов и их активации при переобучении или при отказе нейронов сети. Устройство содержит датчики, вычислительную систему и устройства отображения сигналов диагностики. Вычислительная система содержит модуль, реализованный с возможностью интеллектуального анализа и содержащий динамическую модель, которая реализована на обученной нейронной сети, и модуль, реализованный с возможностью дополнительного обучения нейронной сети и выбора активных и избыточных нейронов. 2 н. и 3 з.п. ф-лы, 5 ил.

Изобретение относится к области сельскохозяйственного машиностроения, в частности к способу автоматической настройки, по меньшей мере, одного из нескольких участвующих в процессе уборки рабочих органов самоходной уборочной машины. Способ включает этап, в котором выполняют начальное моделирование процесса уборки с помощью, по меньшей мере, одной трехмерной графической характеристики (KFAi, KFRi) на основе базы данных, характерной для подлежащего выполнению процесса уборки. Далее на основе начального моделирования определяют начальную рабочую точку (APi), по меньшей мере, одного рабочего органа. Затем адаптируют, по меньшей мере, одну трехмерную графическую характеристику (KFA(n), KFR(n)) на основе текущих полученных путем измерений данных, влияющих на процесс уборки, и определяют новую рабочую точку (AP(n)), по меньшей мере, одного рабочего органа в зависимости от адаптации трехмерной графической характеристики (KFA(n), KFR(n)). Далее выполняют итеративное приближение к новой рабочей точке (AP(n+1)). После шага (AS) приближения к новой рабочей точке (АР(n)) выдерживают время достижения квазиустановившегося поведения машины и оставляют полученные значения установочных параметров рабочих органов в зависимости от результата проверки на достоверность трехмерной графической характеристики (KFA(n), KFR(n)) или возвращаются к их значениям, соответствующим предыдущей рабочей точке (АР(n-1)). Способом обеспечивается гибкое реагирование на изменяющиеся граничные условия в ходе процесса уборки. 10 з.п. ф-лы, 6 ил.

Изобретение относится к области управления виртуальными машинами. Технический результат настоящего изобретения заключается в обновлении виртуальной машины путем запуска виртуальной машины из шаблона виртуальной машины с обновленным программным обеспечением. Способ запуска виртуальной машины содержит этапы, на которых: a) собирают при помощи средства анализа шаблонов данные об установленном на шаблоне виртуальной машины, из которого создана по меньшей мере одна работающая в рамках инфраструктуры виртуальная машина, программном обеспечении; b) назначают при помощи средства анализа шаблонов коэффициент важности непрерывной работы шаблону виртуальной машины на основании ранее собранных данных об установленном на шаблоне виртуальной машины программном обеспечении; c) собирают при помощи средства анализа обновлений данные о наборе обновлений программного обеспечения, установленного на шаблоне виртуальной машины; d) назначают при помощи средства анализа обновлений коэффициент критичности обновлений набору обновлений программного обеспечения на основании ранее собранных данных о наборе обновлений программного обеспечения; e) вычисляют при помощи средства управления обновлениями комбинацию коэффициента важности непрерывной работы и коэффициента критичности обновлений, которая используется для оценки необходимости установки набора обновлений программного обеспечения на шаблон виртуальной машины; f) определяют при помощи средства управления обновлениями необходимость установки набора обновлений программного обеспечения на шаблон виртуальной машины путем сравнения ранее вычисленной комбинации коэффициента важности непрерывной работы и коэффициента критичности обновлений с установленным значением; g) при определении необходимости установки набора обновлений программного обеспечения передают упомянутые шаблон виртуальной машины, набор обновлений программного обеспечения и решение о необходимости обновления программного обеспечения шаблона виртуальной машины средству работы с шаблонами; h) создают при помощи средства работы с шаблонами из упомянутого шаблона виртуальную машину, в рамках функционирования которой установленное программное обеспечение подвергается обновлению с использованием набора обновлений программного обеспечения; i) создают при помощи средства работы с шаблонами шаблон виртуальной машины с обновленным программным обеспечением из виртуальной машины с обновленным программным обеспечением, при этом шаблон виртуальной машины создается из виртуальной машины путем ее остановки и создания образа, соответствующего упомянутой виртуальной машине; j) останавливают при помощи средства работы с шаблонами функционирование виртуальных машин, соответствующих шаблону виртуальной машины, который использовался для создания шаблона виртуальной машины с обновленным программным обеспечением; k) создают при помощи средства работы с шаблонами по меньшей мере одну виртуальную машину из ранее созданного шаблона виртуальной машины с обновленным программным обеспечением. 4 н. и 8 з.п. ф-лы, 5 ил.

Изобретение относится к области управления сложными объектами, которые не удается представить математической моделью в виде систем линейных дифференциальных уравнений, и быстродействующими технологическими процессами и касается нефтехимической, машиностроительной и нефтеперерабатывающей промышленностей. Технический результат - повышение быстродействия и точности управления. Адаптивный интеллектуальный логический регулятор, работающий в условиях нечетко заданной информации, состоит из фаззификатора, блока логического вывода, дефаззификатора, исполнительного органа, объекта управления, датчика обратной связи, ПИД-регулятора, сумматора, блока базы правил подстройки коэффициентов ПИД-регулятора, блока адаптации коэффициентов ПИД-регулятора и блока идентификации технологического процесса. 3 ил.

Изобретение относится к способу управления производственным процессом. Технический результат - управление производственным процессом без простоя производства за счет разработки моделей прогнозирования с использованием информации взаимодействующего зондирующего излучения, параметров управления процессом и событий рабочих прогонов в ходе фактических рабочих прогонов. Способ управления содержит этапы: получения для каждого из множества рабочих прогонов (РП) процесса цифровых входных данных, содержащих информацию от излучения в пределах части электромагнитного или акустического спектра, взаимодействовавшего с матрицей на одном или нескольких участках процесса, вместе с параметром управления процессом и данными о событиях производственного процесса; создания модели прогнозирования (МП), которая связывает информацию зондирующего излучения с определенным параметром управления или событием РП; и использования МП, для создания одного или нескольких из следующих элементов: параметр управления процессом, событие управления процессом и прогнозированное событие рабочего прогона для нового рабочего прогона для применения в управлении производственным процессом. 15 з.п. ф-лы, 3 ил.

Группа изобретений относится к нейронным системам и может быть использована для локального правила состязательного обучения, которое дает в результате разреженную связность среди блоков обработки сети. Техническим результатом является повышение эффективности обучения вычислительной сети. Способ содержит этапы, на которых: вычисляют выходной сигнал блока обработки в вычислительной сети по меньшей мере частично на основании по меньшей мере одного существующего веса и изменяют по меньшей мере один вес блока обработки с использованием локального правила обучения, при этом локальное правило обучения создает разреженную связность между блоками обработки вычислительной сети посредством ограничения нормы весового вектора, содержащего веса, ассоциированные со связями между блоком обработки, до заданного значения. 4 н. и 56 з.п. ф-лы, 11 ил.

Изобретение относится к интеллектуальному контроллеру с адаптивным критиком. Технический результат заключается в повышении адаптационных свойств системы управления на базе интеллектуального контроллера и повышении его быстродействия. Система содержит связанные между собой объект управления, блок критика, решающую нейронную сеть, блок действий, блок расчета подкрепления, блок расчета временной разности, блок выбора действия, блок отбора действий, блок обучения критика и блок занесения действий. 1 ил.

Наверх