5.2 Оптимальное управление

5.2.1 Минимаксное управление

Усложним задачу АКОР неизвестным возмущением с ограниченной энергией. Урав­нение объекта (3.1.1) примет в этом случае вид

х = Ах + Би + Фі. (5.2.1)

Так как f (t) неизвестная функция, то будем искать наихудшее возмущение в смы­сле функционала

в котором 7 - заданное число, a Q - заданая положительно - определенная матрица.

Задача минимаксного управления состоит в том, чтобы найти управление u(t) , которое минимизирует этот функционал и возмущение і (t) , максимизирующее его.

Искомое оптимальное управление имеет вид

и = Стх, Ст = -ВТР, (5.2.3)

а наихудшее возмущение

f = Kfx, Kf = 7-2*TP, (5.2.4)

где положительно-определеная матрица Р является решением следующего уравнения Риккати

РА + АТР - РВВТР + 7"2РФФТР + Q = 0. (5.2.5)

Вывод соотношений (5.2.3) - (5.2.5) повторяет вывод уравнений (3.1.2), (3.1.15), (3.1.16), приведенный в Доказательстве 2.

При 7 —У оо уравнение (5.2.5) совпадает с уравнением Риккати (3.1.15) процедуры АКОР.

Принципиальное различие этих уравнений Риккати состоит в том, что не для лю­бого числа 7 существует положительно- определенная матрица Р , являющаяся ре­шением уравнения (5.2.5). Существует некоторое минимальное число 7 = 7m;n , при котором Р > 0 и при 7 < 7m;n матрица Р становится знакопеременной и поэтому для существования Р > 0 число 7 должно принадлежать интервалу 7m;n < 7 < 00 .

Нетрудно показать, что система (5.2.1), (5.2.3), (5.2.4) асимптотически устойчива: матрица Ас = А-\-ВСт-\-Я> K(s) - гурвицева (имеет собственые числа с отрицательными вещественными частями) и поэтому наихудшее возмущение - затухающая функция с ограниченной энергией.

5.2.2 Управление, обеспечивающее ограниченную -норму

Рассмотрим регулятор, описываемый уравнениями

хр = Ахр + Ри + Фір + А(у-Рхр), fp = A7xp            (5.2.6)

и = Стхр,        (5.2.7)

где

Ст = -ВТР} К = (Е- ~]-2РеР) PeDT} Kf = 7"2ФТР (5.2.8)

Утверждение Если при некотором 7 существуют неотрицательно - определенные матрицы Р и Ре , удовлетворяющие следующим уравнениям Риккати

PA + ATP - PBBTP + 7"2РФФТР + NTN = 0,

(5.2.9)

APe + PeAT - PeDTDPe + ~r2PeNTNPe + ФФТ = 0 (5.2.10) и выполняется условие

Amax[^e]<72, (5.2.11)

где Amax[M] - максимально собственное число матрицы М , то норма передаточной матрицы системы (5.1.1), (5.2.6) - (5.2.8) удовлетворяет неравенству

<7. (5.2.12)

Доказательство утверждения приведено в Доказательстве 6. ■ При 7 —У оо уравнения Риккати (5.2.9) и (5.2.10) совпадают с уравнениями (3.1.15) процедуры АКОР и (4.2.16) фильтра Калмана (если положить в последнем р(2) = Е, PW = Е) , а уравнения (5.2.6), (5.2.7) регулятора совпадают с уравнениями (4.2.28), (4.2.6) оптимального стохастического управления.

Если вектор состояния х объекта (5.1.1) измеряется точно, то регулятор описыва­ется как

и = Стх, Ст = -ВТР, (5.2.13)

где матрица Р > 0 удовлетворяет уравнению (5.2.9), которые совпадают с уравнени­ями минимаксного управления (5.2.3), (5.2.5).

Запишем уравнения регулятора (5.2.6) - (5.2.8) в форме уравнения (5.1.2). Исклю­чая из (5.2.6) переменные и и fр , описываемые уравнениями (5.2.6), (5.2.8), получим матрицы

Ар = А - ВВТР + 7"2ФФТР - KD, (5.2.14)

Рр = К, Р>р = РТР, Рр = 0. (5.2.15) Пример Рассмотрим систему, описываемую уравнениями

х\ = х2 + Ьцщ + V'n/i) ж2 = Ь2іщ + V>2i/i, Уі = жі + аеі 9Х = хъ (5.2.16) ipi = apllx1+apl2x2 + bplly1, хр2 = ap21xt + ар22х2 + Ьр21уи (5.2.17)

щ = арцжр1 + ар12хр2 + /р?/1. (5.2.18)

Передаточная матрица этой системы, состоящая из объекта (5.2.16) и регулятора (5.2.17), (5.2.18) Tzj(juj) , связывающая вектор z = [9\, и\] с вектором возмущения / = [fi, aei] является матрицей размеров 2x2.

Задача состоит в том, чтобы для объекта (5.2.16) с известными коэффициентами найти коэффициенты регулятора (5.2.17), (5.2.18) такие, чтобы выполнялось неравенство

в котором числа pij , peij (ij = 1,2) являются решениями уравнения Риккати вида (5.2.9), (5.2.10).

Искомые коэффициенты находятся в соответствии с (5.2.13) как

Ат

5.2.3 Процедура построения оптимального управления

Утверждение 5.2.2 дает возможность построить оптимальное управление, решаю­щее задачу 6.1.4 путем нахождения наименьших значений 7 на основе следующего алгоритма.

Алгоритм (вычисления 7min) состоит из следующих операций Операция 1. Задаться некоторым числом 7 = 7^) .

Операция 2. Решить уравнение Риккати (5.2.9) и проверить неотрицательность ма­трицы Р . Если Р > 0 , то переходим к следующей операции, в противном случае возвращаемся к операции 1 и увеличиваем 7 .

Операция 3. Решаем уравнение Риккати (5.2.10) при 7 = 7^. Если Ре > 0 , то переходим к следующей операции, в противном случае возвращаемся к операции 1 и полагаем 7 > 7^ .

Операция 4. Проверяем выполнение условия (5.2.11). Если оно выполняется, то воз­вращаемся к операции 1 и уменьшаем 7 (7 < 7^) . В противном случае возвращаемся к операции 2 и увеличиваем 7 (7 > 7^) .

Решение уравнения Риккати в операциях 2 и 3 осуществляется на основе метода диагонализации. Для этого в соответствии с операциями п.3.1.4, п.6.1.3. строятся гамильтонианы

(5.2.20)

и вычисляются их собственые числа и т.д.

Если среди этих чисел хотя бы одно число приближается, при уменьшении 7 , к мнимой оси (Re Аг(Ги) = 0 , либо Re Аг(Гн) (г = 1, 2га)) , то это свидетельствует о том, что матрицы Р либо Ре при уменьшении 7 теряют неотрицательную определенность.

5.2.4 Программное обеспечение и практикум

ГАММА-директива: 131 ( -субоптимальное управление). Исходные данные:

а)         Уравнение объекта (5.1.1).

б)         Матрицы D и а уравнений измеряемых и регулируемых переменных.

в)         Положительный параметр 7 .

а)         Матрицы С и К регулятора (5.2.6),(5.2.7)

б)         Графики переходных процессов по регулируемым переменным.

Используя директиву 131 выполняется практикум Пр.2.3.0дна из его целей состоит в исследовании инженерных показателей (установившихся ошибок ,времени регулиро­вания,перерегулирования) системы в зависимости от параметра 7 .

5.3 Применение. Точное управление 5.3.1 Синтез регулятора

Продолжим решение задачи точного управления, рассмотренной в разделе 3.3, где приведено её рещение для двух видов объектов. Теперь будем рассматривать объ­екты общего вида (которые удовлетворяют лишь требованиям полной управляемости и наблюдаемости), и учтем помехи измерения. В этом случае синтезируемая система описывается уравнениями (5.1.1)

е)Время моделирования переходных процессов. Результаты:

х = Ах + Ви + Фі, у = Р>х + ае, в = Ах,

Аналогично установившемся ошибкам по регулируемым переменным, введем уста­новившееся значение управления как

Uj уСТ = lim sup |u,-(t)| (j = l,m) (5.3.6)

Задача точного управления состоит в нахождении матрицы регулятора (5.3.2) та­ких, чтобы система (5.3.1), (5.3.2) удовлетворяла требованиям

0?\уст < Uj,ycT<u* (г, j = 1, m), (5.3.7) где в*, и* (г, j = 1, га) -заданные числа.

Заметим, что решение этой задачи не может существовать. В этом случае требуется найти регулятор

где Q0 , R и L - весовые диагонально-положительные матрицы размеров m X m , mxmn/iX/i - соответственно. Элементы первых двух матриц определяются так, чтобы выполнялись требования к установившейся точности, а матрица L , для про­стоты, полагается единичной.

Уравнения Риккати (5.3.11), (5.3.12) совпадают с уравнениями (5.2.9), (5.2.10) при единичных весовых матрицах.

Утверждение Если коэффициенты весовых матриц Q0 и Р удовлетворяют усло­виям

(pi + Р2) £ /Г2 + £ -f   (pi + ы £ /;2 + £ а$

>          ^          L r(o) >            ^          L а = та

—        0*2      ' 'ч —   и*2      У1 1'"Чі

(5.3.14)

то установившиеся движение в системе (5.3.1), (5.3.9), матрица регулятора которой вычисляется по формулам (5.3.10) - (5.3.12) и при выполняется неравенство (5.3.13), обладает свойством

0 .V.4 ' С'ЛгГ ■ Mj,ycT < <,Уст7 (bJ = l,^)- (5.3.15)

Из этого утверждения, доказанного в [5.7], следует, что числа ид и ии в неравен­ствах (5.3.8) равны 72 и поэтому при минимальном 7 = 7* эти числа v$ = ии = 7*2 . Если 7*2 < 1 , то задача решена и требования (5.3.7) к точности выполняются.

Заметим, что переходные процессы в системе (5.3.1), (5.3.9), удовлетворяющей тре­бованиям к точности, могут быть очень медленными. Выбирая элементы матрицы L , отличные от единичных, можно [5.7] увеличить быстродействие системы.

5.3.2 Программное обеспечение и практикум

ГАММ А-директива: 131 (Точное управление объектом общего вида). Исходные данные: а)Уравнение объекта (5.3.1)

в)         Вектор границ внешних возмущений и помех.

г)         Вектор границ допустимых значений установившихся ошибок.

д)         Шаг изменения параметра 7 .

Результаты:

а)         Матрицы С , А и Kj регулятора (5.3.9).

б)         Графики переходных процессов по регулируемым переменным.

Используя директиву 131 выполняется практикум Пр. 2.5.0 дна из его целей состоит в исследовании инженерных показателей.


Авторы: 239 А Б В Г Д Е З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Э Ю Я

Книги: 268 А Б В Г Д Е З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Э Ю Я