Способ адаптивной автоматической настройки многопараметрических систем автоматического управления на оптимальные условия

 

Изобретение относится к автоматической оптимизации многопараметрических объектов управления, обладающих одноэкстремальной функцией качества, основанной на каком-либо критерии оптимальности. Технический результат заключается в повышении быстродействия самонастройки. Способ реализуется следующим образом. В пространстве оптимизируемых параметров из исходного состояния делается шаг в случайном направлении в соответствии с равномерным законом распределения. Если значение функции качества в новом состоянии больше или равно значению функции качества в исходной точке (то есть случайная проба оказалась неудачной), то система возвращается в первоначальное состояние, после чего снова формируется случайный шаг, отсчитанный из старого состояния. Адаптация распределения направления случайных шагов заключается в изменении их математического ожидания на основе знака приращения функции качества, а адаптация величины случайных шагов - на основе соотношения удачных и неудачных проб в процессе настройки. 1 табл.,1 ил.

Изобретение относится к автоматической оптимизации многопараметрических объектов управления, обладающих одноэкстремальной функцией качества, основанной на каком-либо критерии оптимальности.

Известны способы случайного поиска экстремума функции качества одноэкстремальных многопараметрических объектов, заключающиеся в формировании случайных входных шаговых воздействий на объект управления [1].

Недостатком таких способов является отсутствие адаптации величины случайных входных шаговых воздействий в процессе поиска, что приводит к значительному снижению их эффективности и быстродействия.

Наиболее близким к изобретению по технической сущности является способ, основанный на формировании случайных равномерно распределенных входных шаговых воздействий на объект управления и адаптации их распределения и величины [2].

Недостатком этого способа является невысокое быстродействие поиска и отсутствие универсальности применения, так как алгоритм адаптации величины входных шаговых воздействий в этом способе был получен для частного случая объекта оптимизации.

Предлагаемый способ заключается в том, что создается режим адаптивного случайного поиска в пространстве оптимизируемых параметров, основанный на формировании случайных входных шаговых воздействий на объект управления, распределенных по равномерному закону, математическое ожидание которых автоматически адаптируется в зависимости от сигнала, поступающего с выхода объекта по каналу обратной связи, а адаптация величины случайных входных шаговых воздействий осуществляется на основе соотношения удачных и неудачных проб в процессе настройки.

На чертеже представлена блок-схема алгоритма, реализующего предлагаемый способ автоматической настройки многопараметрических систем автоматического управления на оптимальные условия (вариант алгоритма с пересчетом, для определенности представлен случай минимизации функции качества).

Способ реализуется с помощью алгоритма, блок-схема которого включает в себя: 1 - блок формирования шага в случайном направлении в пространстве оптимизируемых параметров в соответствии с равномерным законом распределения, 2 - блок запоминания сформированного шага, 3 - блок определения значения функции качества в новой точке пространства оптимизируемых параметров, 4 - блок определения знака приращения функции качества, 7 - блок запоминания значения функции качества при удачном шаге, 5 и 8 - блоки адаптации распределения направления и величины случайных шагов в пространстве оптимизируемых параметров, 6 - блок формирования шага в обратном направлении при неудачном шаге.

Предлагаемый способ реализуется следующим образом.

В пространстве оптимизируемых параметров из исходного состояния Xi делается шаг в случайном направлении в соответствии с равномерным законом распределения. Если значение функции качества в новом состоянии Q(Xi+1) больше или равно значению функции качества в исходной точке Q(Xi), то есть случайная проба оказалась неудачной (задача минимизации), то система возвращается в первоначальное состояние Хi, после чего снова формируется случайный шаг, отсчитанный из старого состояния.

Рекуррентная формула для смещения в пространстве оптимизируемых параметров по этому алгоритму имеет следующий вид: где Qi 0=min Q(Xj), j=1,..., i - наименьшее значение функции качества за i предыдущих шагов поиска; F(,W) - единичный вектор, определяющий направление случайного шага: где - единичный случайный вектор, равномерно распределенный по всем направлениям пространства оптимизируемых параметров с нулевым математическим ожиданием; W - вектор памяти (математическое ожидание направления случайных шагов), реализующий адаптацию распределения направления шагов, ai - величина рабочего шага на i-м шаге поиска.

Адаптация распределения направления случайных шагов заключается в изменении их математического ожидания на основе знака приращения функции качества (блоки 5 и 8 на чертеже). Алгоритм непрерывной адаптации математического ожидания случайных шагов можно представить в виде следующего векторного рекуррентного соотношения: Wi+1 = kWi-QiXi,
где W - математическое ожидание равномерно распределенных случайных шагов;
k - коэффициент запоминания (0k1);
- параметр скорости обучения (01).

При работе по этому алгоритму адаптации вектор W стремится перестроиться в направлении, обратном градиенту функции качества оптимизируемого объекта, то есть шаги поиска будут в среднем направлены в сторону быстрейшего уменьшения функции качества. Алгоритм адаптации величины случайных шагов можно представить в виде следующего выражения:

где li и si - соответственно число удачных и неудачных проб, совершенных до i -го шага оптимизации.

Смысл этого алгоритма заключается в следующем. Если в процессе поиска имеется значительное число удачных проб, то величина шага увеличивается. Однако, если начинают преобладать неудачные поисковые шаги, то, очевидно, система приблизилась к экстремуму функции качества, и величина входных шаговых воздействий уменьшается.

Если имеются определенные априорные данные о виде функции качества объекта оптимизации, то необязательно использовать всю информацию о неудачных и удачных пробах, можно ограничиться данными за последние N шагов оптимизации. Однако N не должно быть слишком малым, иначе точность отыскания экстремума будет недостаточно высокой. Как показали эксперименты на модельных функциях, для большинства случаев оптимальным числом является N=100, что достаточно для высокой мобильности алгоритма адаптации величины шага и для отыскания экстремума с высокой точностью.

Достигаемый технический эффект от применения предлагаемого способа позволяет уменьшить потери на поиск и повысить быстродействие отыскания экстремума: экспериментальные исследования, проведенные на модельных функциях, показали, что выигрыш в быстродействии предлагаемого способа по сравнению с прототипом составил от 32 до 55 % в зависимости от вида модельной функции (см. таблицу). Помимо алгоритмической простоты предлагаемого способа, он обладает также универсальностью применения, что позволяет использовать его независимо от конкретного вида функции качества.

Центральная модель:

Центральная модель является моделью сепарабельного объекта управления, у которого отсутствует перекрестное влияние входных параметров.

Квадратичная модель:

где [A, X] - скалярное произведение вектора параметрических коэффициентов А=(а1, а2, а3, а4)T и вектора входных координат Х = (x1, x2, x3, x4)T, аi=1, i=1...4, bij - элементы матрицы:

Квадратичная модель имеет более сложную структуру по сравнению с центральной и моделирует несепарабельный объект с перекрестным влиянием параметров.

Функция Пауэла:
Q(X)=(х1+10х2)2+5(х34)4+(х2-2х3)4+10(х14)4
Функция Пауэла моделирует объект оптимизации с ярко выраженной овражностью функции качества.

Все модельные функции имеют один минимум при хi=0, i=1...4.

При проведении сравнительного тестирования использовался одинаковый для всех моделей набор из ста начальных точек поиска, координаты которых представляли собой случайные равномерно распределенные числа в пределах от минус 10 до плюс 10. Цикл поиска экстремума для каждой начальной точки повторялся 1000 раз. Для всех трех моделей параметры поиска были одинаковыми: коэффициент запоминания k=0,7; параметр скорости обучения =0,1. Поиск экстремума производился с точностью до 0, 01.

ЛИТЕРАТУРА
1. Растригин Л.А. Системы экстремального управления. М.: Наука, 1974, с. 422-432.

2. Растригин Л.А. Адаптация сложных систем. Рига: Зинатие, 1981, с.88-91, с.106-107 (прототип).


Формула изобретения

Способ адаптивной автоматической настройки многопараметрических систем автоматического управления на оптимальные условия путем создания режима адаптивного случайного поиска в пространстве оптимизируемых параметров, основанный на формировании случайных входных шаговых воздействий на объект управления, математическое ожидание которых автоматически адаптируют в зависимости от сигнала, поступающего с выхода объекта по каналу обратной связи в соответствии с соотношением
Wi+1 = kWi-QiXi,
где W - математическое ожидание равномерно распределенных случайных шагов;
k - коэффициент запоминания;
- параметр скорости обучения;
Q - функция качества;
Х - состояние объекта в пространстве оптимизируемых параметров,
отличающийся тем, что величину случайных входных шаговых воздействий в процессе настройки на оптимальные условия автоматически адаптируют на основе соотношения удачных и неудачных проб в соответствии с выражением

где а - величина шага случайного входного шагового воздействия;
li - число удачных случайных проб, совершенных до i-го шага поиска;
si - число неудачных случайных проб, совершенных до i-го шага поиска.

РИСУНКИ

Рисунок 1, Рисунок 2



 

Похожие патенты:

Изобретение относится к автоматической оптимизации многопараметрических объектов управления, обладающих одноэкстремальной функцией качества, основанной на каком-либо критерии оптимальности

Изобретение относится к вычислительной технике и может использоваться в гибридных аналого-цифровых устройствах и системах обработки аналоговых сигналов

Изобретение относится к робототехнике и может быть использовано при создании систем управления приводами роботов

Изобретение относится к радиоизмерительной технике и может найти применение для адаптивной коррекции параметров динамических характеристик сложных нелинейных и нестационарных радиотехнических устройств и систем, содержащих радиокомпоненты как с аналоговыми, так и с цифровыми сигналами, например квадратурный демодулятор с АЦП на выходе, который широко используется в радиолокационных системах, пеленгаторах и гидролокационных системах с фазированными антенными решетками

Изобретение относится к способу управления технологическим процессом

Изобретение относится к технической кибернетике и может быть использовано в системах управления объектами с запаздыванием по состоянию нейтрального типа

Изобретение относится к системам автоматического управления и может быть использовано в системах регулирования объектами, параметры которых - неизвестные постоянные или меняющиеся во времени величины

Изобретение относится к системам автоматического управления и может быть использовано для линейных динамических объектов управления, причем параметры объекта - неизвестные постоянные или медленно меняющиеся во времени параметры

Изобретение относится к системам автоматического управления и может быть использовано для линейных динамических объектов управления с запаздыванием по состоянию, причем параметры объекта - неизвестные постоянные или медленно меняющиеся во времени параметры

Изобретение относится к области автоматического управления колебательными объектами с нестабильными резонансными частотами

Изобретение относится к автоматической оптимизации многопараметрических объектов управления, обладающих одноэкстремальной функцией качества, основанной на каком-либо критерии оптимальности

Изобретение относится к промышленной экологии и может быть использовано для создания систем мониторинга массовых выбросов загрязняющих веществ в окружающую среду

Изобретение относится к области систем автоматического управления динамическими объектами широкого класса с неизвестными переменными параметрами и неконтролируемыми возмущениями

Изобретение относится к системам автоматического управления динамическими объектами широкого класса с неизвестными переменными параметрами и неконтролируемыми возмущениями

Изобретение относится к области автоматического управления и предназначено для преобразователей напряжения с широтно-импульсной модуляцией

Изобретение относится к системам автоматического управления и может быть использовано для линейных динамических объектов управления, причем параметры объекта - неизвестные постоянные или медленно меняющиеся во времени параметры

Изобретение относится к системам автоматического управления и может быть использовано для линейных динамических объектов с запаздыванием по управлению, причем параметры объекта - произвольно меняющиеся параметры в замкнутых пределах

Изобретение относится к робототехнике и может быть использовано при создании систем управления приводами роботов

Изобретение относится к робототехнике и может быть использовано при создании систем управления приводами роботов

Изобретение относится к системам управления с переменной структурой и предназначено для управления объектами с переменными параметрами, а именно с изменяющимся моментом инерции, приведенным к валу исполнительного электродвигателя
Наверх