3.1 Процедуры аналитического конструирования регуляторов

3.1.1 Построение регулятора на основе метода динамического програм­мирования

Рассмотрим объект управления, возмущенное движение которого описывается в первом приближении уравнением

х = Ах + £и; x(t0) = x(0), to = 0, (3.1.1)

где А и В - заданные, матрицы чисел размеров пхп и га X т соответственно. Требуется найти матрицу чисел С (размеров га х га) уравнения регуляторов

и = С'х, (3.1.2)

такую, чтобы на асимптотически устойчивых движениях системы (3.1.1), (3.1.2), воз­бужденных произвольными начальными отклонениями , минимизировался функ­ционал

оо

J = J(x'Qx + u'u) dt, (3.1.3)

о

где Q - заданная положительно-определенная матрица размеров пхп (х'фх > 0 для всех х, это обозначается далее Q > 0).

Матрицу С закона управления (3.1.2) иногда называют матрицей коэффициентов усиления регулятора.

Переходя к решению этой задачи об оптимальной стабилизации на основе метода динамического программирования, ограничимся вначале случаем п = т = 1. В этом случае уравнения системы и функционал примут вид

Предпоследнее равенство выражает необходимое условие экстремума правой части (3.1.7). Нетрудно проверить, что при этом управлении достигается ее минимум. Дей­ствительно,

d2

2          2 ®V t 7 \

qx + и + тг- [ах + ои) Ох

du2

2 > 0.

Этот минимум - единственный и поэтому единственно управление вида (3.1.8). Правда, как будет показано ниже, уравнению (3.1.7) удовлетворяет не единственная функция v. Эта функция доопределяется из условия устойчивости системы (3.1.1), (3.1.2).

Исключая и из (3.1.7) с помощью (3.1.8), получим нелинейное уравнение в частных производных:

dv dv 1 f dv Л2 9       . л .

-m=eiax-\W) +qx- (зл'9)

Решение этого уравнения при краевом условии

v[x(t!)] = О (h -+ оо)

будем искать в виде

v = рх2; р = const. (3.1.10) Подставляя это выражение в (3.1.9), получим

0 = 2рах2 - (рЪ)2х2 + qx2. (3.1.11)

Отсюда следует алгебраическое уравнение для определения неизвестного коэффи­циента р в (3.1.10):

2pa-p2b2 + q = 0 (3.1.12)

Из двух решений

+ + D(2)_ .я /£! + _£.

Р Ь2 + \] ¥ + Ь2' Р Ь2 \] ¥ + Ь2 этого уравнения выбираем первое исходя из условия положительности функции и, обеспечивающего асимптотическую устойчивость синтезируемой системы, а следова­тельно, и выполнение краевого условия и[ж(оо)] = 0. На основе (3.1.8) получаем

и = (-р(%)х, (3.1.13)

и, таким образом, искомое число

с = -рЩ. (3.1.14)

В общем случае (га > 1, т > 1) уравнения (3.1.12), (3.1.14) аналитического кон­струирования регуляторов имеют вид

РА + А'Р - РВВ'Р + Q = 0; (3.1.15)

С = -РВ, (3.1.16)

где Р - симметричная матрица чисел размеров пхп.

Вывод этих уравнений приведен в Доказательстве 2. Уравнение (3.1.15) назва-ется матричным уравнением Риккати (смысл такого названия станет ясен несколько позже).

Процедура аналитического конструирования регуляторов (процедура АКОР) со­стоит из трех операций: 1) решение уравнения Риккати, 2) выделение из всего множества этих решений матрицы Р° > 0 (численный метод нахождения Р° приве­ден ниже), 3) вычисление искомой матрицы коэффициентов усиления регулятора по формуле

С = -Р°В. (3.1.17)

Убедимся непосредственно, что матрица С, определяемая соотношением (3.1.17), обеспечивает асимптотическую устойчивость системы (3.1.1), (3.1.2). Для исследова­ния устойчивости системы х = (А-\- ВС')х воспользуемся прямым методом Ляпунова. Примем в качестве функции Ляпунова v = х'Р°х > 0 и вычислим полную производ­ную этой функции:

пи

Учитывая, что матрица С определяется выражением (3.1.17), получим, с учетом того, что Р° удовлетворяет (3.1.15),

Если объект (3.1.1) полностью управляем и Q > 0, то среди решений системы (3.1.15) всегда найдется и при том единственная положительно-определенная матрица Р°. Напомним, чтоусловием полной управляемости объекта (3.1.1) является равенство

ранг [В, АВ}...} А^-^В] = п, (3.1.18)

которое будем называть условием управляемости пары (А}В). Если матрица Q -неотрицательно-определенная матрица (Q > 0), то ее всегда можно представить в виде

Q = Н'Н}

где Н матрица размеров X х п (х~ ранг матрицы Q) . Среди решений (3.1.15) по-прежнему существует [3.6] единственная матрица Р°, если Q в функционале (3.1.3) неотрицательно - определенная матрица, удовлетворяющая условию полной управля­емости пары (А', Н') :

ранг [Я', А'Н',..., A{n-iyH'] = п.

Требование полной управляемости пар (А, В), (А', Н') для существования и един­ственности Р° > 0 можно ослабить, заменив его условием стабилизируемости этих пар [3.6].

Пример. Аналитическое конструирование регулятора гирорамы. Осуще­ствим первый этап (составление уравнений (3.1.15), (3.1.16)) аналитического констру­ирования регулятора гирорамы.

Опишем вначале физическое содержание задачи стабилизации гирорамы [3.3], по­скольку на примере решения этой задачи будут иллюстрироваться результаты, приве­денные в этой и следующих главах.

Рассмотрим трехстепенной гироскоп в кардановом подвесе (рис. 3 .1.1). Его урав­нения имеют вид [?]:

a - угол поворота наружной рамы относительно оси OY\ (3 - угол поворота внутрен­него кольца карданова подвеса относительно оси ОХ (угол прецессии); JH - момент инерции наружной рамы (кольца) относительно оси OY\ J3 - экваториальный момент инерции гироскопа; JB, JBX, JBy - моменты инерции внутреннего кольца карданова подвеса относительно осей OZ} ОХ} OY соответственно, при этом JBX = JBy = JB3; Н - кинетический момент гироскопа; Мх и Му - моменты относительно осей ОХ и OY соответственно; па, пр - коэффициенты демпфирования.

Гироскоп в кардановом подвесе используется (если установить на оси OY датчик угла) для измерения углов поворота движущегося объекта (например, ракеты) отно­сительно оси OY. Однако из-за вредных моментов по этой оси (трения, дисбаланса ит. п.) гироскоп начинает "прецессировать" относительно оси ОХ} т. е. ось OZ начинает поворачиваться в направлении оси OY, и гироскоп теряет свойство быть индикатором поворота летательного аппарата. Явление прецессии следует непосред­ственно из уравнения (3.1.20), если в нем пренебречь всеми слагаемыми в левой части, кроме последнего слагаемого (так как Н ^> J3} JB3, JB, па). Прецессию можно из­мерить, установив на оси ОХ датчик угла. Усилим этот сигнал и подадим его на

двигатель, который развивает полезный момент, равный и противоположный по знаку вредному. Тогда прецессия прекратится и гироскоп будет сохранять свои функции. Гироскоп в кардановом подвесе с системой стабилизации угла прецессии называется гирорамой. Ее схема приведена на рис. 3.1.2, где ДУП - датчик угла прецессии, ДМ -датчик момента (двигатель).

Подпись:

Рис. 3.1.2

Запишем уравнения (3.1.19), (3.1.20) в форме Коши.

Пренебрегая значениями J3, JB3, JB по сравнению с JH, полагая Мх = 0 и вводя обозначения

запишем уравнения (3.1.19), (3.1.20) в виде

xi = ж2; ж2 = a22^2 + «23^3 cos жі + i?2^3 sin Жі cos жі; (3.1.21)

жз = «32^2 cos жі + а33ж3 + R3X3X2 sin жі + b31u + ш3і/.          (3.1.22)

Разлагая правые части этих уравнений в ряд Тейлора в окрестности точки х\ = ж2 = ж3 = 0, получим уравнения первого приближения

где и пропорционально моменту, развиваемому датчиком моментов, а           / пропорцио-
нально вредному моменту по оси OY.

Полагая пока / = 0, будем искать управление

при котором на движениях гирорамы (возбужденных начальными отклонениями) ми­нимизируется функционал

Переходя к решению этой задачи, запишем уравнения (3.1.15), (3.1.16) процедуры АКОР. Первое из этих уравнений имеет вид

Таким образом, аналитическое конструирование регулятора гирорамы (системы стабилизации гирорамы) сводится к решению алгебраических уравнений (3.1.26) и на­хождению искомых параметров регулятора (3.1.24) по формулам (3.1.28).

3.1.2 Нестационарные объекты

Рассмотрим полностью управляемый нестационарный объект, описываемый урав­нением

х = A(t)x + B(t)u, x(t0) = x(0), (3.1.29)

в котором Ait) и Bit) известные на интервале [t0, t\] матрицы функций. Пусть критерий качества имеет вид

где Q(t) и P^ - заданные положительно-определенные матрицы функций и чисел соответственно.

Требуется найти матрицу С it) регулятора

u = C"(t)x, (3.1.31)

при которой на движениях системы (3.1.29), (3.1.31), возбужденных произвольными начальными отклонениями, минимизируется функционал (3.1.30).

Переходя к решению этой задачи, рассмотрим вначале случай га = т = 1. Тогда уравнения системы и функционал оптимизации примут вид:

Функцию v , разрешающую задачу АКОР для нестационарного объекта (3.1.29), бу­дем искать в виде v = p(t)x2 . Подставляя ее в (3.1.9), получим вместо алгебраического уравнения (3.1.11) дифференциальное уравнение

-p(t) = 2p(t)a(t) - p2{t)b2(t) + q(t) = 0 (3.1.35)

и краевое условие

p(t1)=p{1). (3.1.36)

Уравнение (3.1.35) является специальным видом дифференциального уравнения, решение которого изучалось еще в XVIII в. итальянским математиком Я. Риккати, именем которого оно и названо.

В общем случае (га > l,m > 1) уравнение (3.1.35) и краевое условие (3.1.38) имеют вид:

-P(t) = P(t)A(t) + A'(t)P(t) - P(t)B(t)B'(t) + Q(t). (3.1.37)

P(ti) = pW. (3.1.38)

Уравнение (3.1.37) называется матричным дифференциальным уравнением Рик­кати. Его нетрудно получить, повторяя изложенное в Доказательстве 2.

Переходя к решению уравнения (3.1.37), введем "новое время" т = t\ — t и обозна­чим P(t) = P(ti — т)

Таким образом, краевая задача для уравнения (3.1.37) свелась путем введения но­вого (обратного) времени к задаче решения уравнения (3.1.39) с известным начальным условием (3.1.40). Для его численного решения можно использовать любой из из­вестных методов интегрирования обыкновенных дифференциальных уравнений (метод Рунге-Кутта, Эйлера и т. п.).

Решив уравнение (3.1.40), найдем искомую матрицу

C(t) = P(U -t)B(t).       (ЗАЛІ)
Иногда функционал (3.1.30) имеет более общий вид

Таким образом, оптимальное в смысле функционала (3.1.42) управление объектом (3.1.29) записывается как u = (7'(t)x, где С = -P(t)B(t) или u = Н^~1С'к = C"(t)x, в котором

C(t) = -P(t)B(t)Q^~\ (3.1.46) где P(t) - решение уравнения Риккати:

-P(t) = P(t)A(t) + A'(t)P(t) - P(t)B(t)Q^-\t)B\t)P(t) + Q(t); (3.1.47)

P(t0) = P{1\ (3.1.48)

3.1.3 Численное решение матричного алгебраического уравнения Рик-кати. Метод Репина - Третьякова

Возвращаясь к матричному алгебраическому уравнению Риккати, разрешающему задачу АКОР для стационарных объектов, отметим, что численное решение нели­нейных алгебраических уравнений является не менее трудной проблемой, чем реше­ние краевой задачи для обыкновенных дифференциальных уравнений или уравнений а частных производных. Однако специфический характер уравнения (3.1.15) и его природа позволили разработать ряд эффективных численных методов его решения: Репина-Третьякова [3.5], Ньютона-Рафсона [3.6], диагонализации [3.7].

Опишем первый из этих методов. В связи с этим положим, что верхний предел в функционале (3.1.3) конечен, и тогда функционал оптимизации имеет вид

Конечный верхний предел приводит к тому, что при п = т = 1 функцию (3.1.10) следует искать в виде v = p(t)x2 . При этом должно выполняться краевое условие v(x(t\)) = 0 (или p(t\) = 0). Тогда, повторяя изложенное в начале

 4.1, получим дифференциальное уравнение и краевое условие

-P(t) = P(t)A + A'P(t)-P(t)BB'P(t) + Q; P{h) = 0 (3.1.50)

Вводя, как и в нестационарном случае, т = t\—t и обозначая Pit) = P(t\—T) = Р(т) , запишем (3.1.50) как

- Р(т)А + А'Р(т)-P(t)BB'P(t) + Q; 0 < т < h; (3.1.51)

Переходя к методу Репина-Третьякова, отметим, что он опирается на доказанное в работах [3.27], [3.5] соотношение

Ит Р(т) = Р° (3.1.53)

[так как т изменяется в пределах от 0 до t\ , то (3.1.53) имеет смысл, если t\ может принимать различные фиксированные значения, в частности t\ = оо].

Из предельного соотношения (3.1.53) следует, что для нахождения положительно - определенной матрицы Р° , удовлетворяющей алгебраическому уравнению Риккати (3.1.15), достаточно решать систему дифференциальных уравнений (3.1.46) до тех пор,

пока его решение не установится (-Р(т) , не перестанут изменяться во времени г), и это установившееся решение и есть искомая матрица Р° .

Пример. Численное решение задачи об аналитическом конструировании оптимального регулятора гирорамы. Пусть заданы значения параметров гиро­рамы (3.1.23) и функционала оптимизации (3.1.25):

а22 = -300; а23 = 103; а32 = -3; а33 = -1; Ъ31 = 10"3; (3.1.54)

ди = 1,6- 1(Г; q22 = 3 • 10й; q33 = 5 • 10а. (3.1.55)

Подставляя в правые части уравнений (3.1.26) вместо нулей соответствующие про­изводные (так, в первом уравнении нужно подставить р\\ , во втором - р\2 , в третьем - р\3 ит. д.) и решая полученную систему из шести дифференциальных уравнений с помощью метода Рунге-Кутта, получим:

р°п = 53,4 • 109;р°12 = 147 • 106;р°13 = 12,6 • 108;р22 = 29 • 104; (3.1.56)

р°3 = 44-105;р°3 = 116-106. (3.1.57)

Искомые параметры регулятора вычисляются на основе чисел (3.1.57):

сі = -0,126 • 107; с2 = 0,44 • 104; с3 = -116 • 103. (3.1.58)

3.1.4 Численное решение уравнения Риккати методом диагонализации

Этот метод основан на вычислении корней характеристического полинома следую­щей матрицы,которая формируется из матриц,входящих в уравнение Риккати

(3.1.59)

А -ВВТ -Q Ат

Эта матрица размеров 2га X 2га называется гамильтонианом.

Ее характеристический полином g(s) = det(Es — Г) является полиномом четных степеней s . Это означает, что если А - корень этого полинома (собственное число матрицы Г, то —А также является его корнем. Таким образом, матрица Г имеет Ai,. . . , Хп собственных чисел с отрицательными вещественными частями и — Ai,. . ., — Хп собственных чисел с положительными вещественными частями.

Искомая матрица Р° вычисляется по формуле

р(°) = Р2.р-\ (3.1.60)

где Pi и Р2 - квадратные матрицы, формируемые следующим образом:

а)         . Вычислить собственные числа матрицы Г .

б)         . Решить уравнения

(ЯЛ,-- Г)с,-= 0 (і = 1,п)

и сформулировать из собственных векторов Сі (г = 1,га) 2га X 2га матрицу С .

в). Обозначить первые га строк матрицы С как Pi , а последующие га -строк -

3.1.5 Критерий обобщенной работы

В 1967 г. А.А. Красовский предложил [3.8] упрощение процедуры АКОР с вычисли­тельной стороны. Для этого в функционал (3.1.3) вводится дополнительное слагаемое, с учетом которого функционал оптимизации принимает (в развернутой форме) вид

где квадратичная форма v = х'Рх содержит положительно-определенную матрицу Р , являющуюся решением матричного алгебраического уравнения

PA + A'P + g = 0. (3.1.62)

Оптимальное управление определяется по-прежнему на основе формулы (3.1.16). Для того чтобы убедиться в этом, положим вначале га = т = 1 . Функционал (3.1.61) примет вид

J= j {qx' + u2 + - ( —b) } dt. (3.1.63)

Подставляя в уравнение (3.1.9) вместо qx2 выражение

2 1 fdvX qX + 4 {д-хЬ) '

получим вместо нелинейного алгебраического уравнения (3.1.12) линейное уравнение

2pa + q = 0 (3.1.64)

для определения коэффициента р квадратичной формы v = рх2 .

Таким образом, аналитическое конструирование по критерию обобщенной работы состоит в решении линейного алгебраического уравнения (3.1.62) и вычисления ис­комой матрицы С по формуле (3.1.16). Уравнение (3.1.62) называется уравнением Ляпунова. Оно имеет единственное решение Р > 0 , когда собственные числа матрицы А имеют отрицательные вещественные части. При этом условии нетрудно показать, что синтезированная система асимптотически устойчива. Действительно, в соответ­ствии с прямым методом Ляпунова примем в качестве функции Ляпунова функцию v = х'Рх > 0 , вычисляя ее полную производную по времени, получим, что

пи

dt         1 1

Функционал (3.1.61) называется [3.9] критерием обобщенной работы. Это название

связано с тем, что последнее слагаемое в (3.1.61) можно записать как / <птиопт dt,

который выражает собой "энергию" (обобщенную работу) оптимального управления иопТ .

3.1.6 Нелинейные объекты

Рассмотрим объект управления, описываемый уравнениями

m

Пусть правые части этих уравнений разложимы в ряд Тейлора в окрестности точки х\ = . . . = хп = их

Требуется найти управления

ик = гк(хи ...,хп)(к = 1, га), (3.1.67)

при которых на движениях системы (3.1.66), (3.1.67), возбужденных произвольными начальными отклонениями, минимизируется функционал (3.1.3). Решение этой задачи получено в [3.10].

Приведем это решение, ограничиваясь для простоты случаем п = m = 1 . В этом случае уравнения (3.1.66) запишем (обозначая ат = а^ , ацц = а^ и т.д.) так:

х = ах + а^х2 + а^ж3 + . . . + Ъи.

Уравнение (2.3.11), (2.3.12) метода динамического программирования имеют в рас­сматриваемом случае вид

Исключая и из (3.1.68) с помощью (3.1.69), получим

dv dv . (9\ о (п\ п . 1 f dv Л2 о           . „ .

Решение этого уравнения будем искать в виде

Приравнивая нулю совокупность коэффициентов при одинаковых степенях ж , по­лучим уравнения для определения неизвестных параметров р , р^ , р^,. . . формы (3.1.71). Так, для совокупности коэффициентов при ж2 имеем

2ра - (pb)2 + q = 0 (3.1.73) для совокупности коэффициентов при х3 получим

2ра(2) + 2р{3)а - h2(2p)(3p(3)) = 0 (3.1.74)

и т. д.

Уравнение (3.1.73) совпадает с уравнением (3.1.12) и его решение имеет вид

(л\ а а2 а

pt =v + h + v-

Уравнения (3.1.74) запишем в более удобной форме с учетом (3.1.14) Это уравнение в отличие от (3.1.73) является линейным уравнением для опреде­ления коэффициента р^ формы (3.1.71). Решение этого уравнения существует, если а + be ф 0 . Последнее выполняется в силу асимптотической устойчивости уравнения ж = (а + Ьс)х , описывающего замкнутую оптимальную в смысле функционала (3.1.3) систему с линейным объектом (3.1.1).

Приравнивая нулю совокупность коэффициентов при ж4 , получим

4pW(a + be) = -2pVaW - Зр^аЮ + |b2(3^3))2. (3.1.75) Это уравнение, как и предыдущее, является линейным относительно неизвестного

(4)

параметра рк ' и т. д.

В соответствии с (3.1.69) искомое управление имеет вид

Ее коэффициенты pij (г, j = l,n) находятся в результате решения алгебраиче­ского уравнения Риккати (3.1.15), а коэффициенты pilk (і, j, к = 1,га кубичной и последующих форм являются решениями линейных алгебраических уравнений Ляпу­нова вида (3.1.62), в которых вместо матрицы А нужно подставить матрицу А-\- ВС (С-матрица оптимального управления (3.1.2) для линейного объекта), a Q-это из­вестная матрица, составленная из матриц, полученных для предшествующих форм.

3.1.7 Детерминированные внешние возмущения

Рассмотрим объект управления, описываемый уравнением

где fit) - ц -мерный вектор внешних возмущений; Ф -размеров п X ц . Относительно вектора fit) известно, что: 1) его компоненты ограничены по модулю

(3.1.79)

заданная матрица чисел

где /* (г = 1,/і)-заданные числа 2) функции fi(t) (г

3) вектор fit) измеряется. Требуется найти управление

и = С'х + -Я'ОД,

(3.1.82)

[ Lit) -некоторая матрица размеров п X п ], такое, чтобы на движениях системы (3.1.79), (3.1.82), возбужденных произвольными начальными условиями и внешними возбужде­ниями, минимизировался функционал (3.1.3):

J = j (x'Qx + u'u) dt.

(3.1.83)

Отметим, что требование (3.1.81) необходимо для сходимости интеграла (3.1.83).

Аналитическое конструирование регулятора при внешних возмущениях состоит [3.12] из операций: 1) вычисления матрицы С в соответствии с процедурой 3.1.1 аналити­ческого конструирования при f = 0 ; 2) решения дифференциального уравнения

L = -(A + BC')'L -{P + P')Vf(t) (3.1.84)

и определения матрицы Lit) , входящей в закон оптимального управления (3.1.82).

Для доказательства рассмотрим случай п = т = ц = 1 . В этом случае уравнение (3.1.79) примет вид

ж = ах + Ъи + ф/, (3.1.85) а функционал (3.1.83) запишется как

Уравнение метода динамического программирования примет вид

dv dv . , „. 1 f dv Л2 9

Решение этого уравнения будем искать в виде

v = рх2 + k(t)x + l0(t), (3.1.88)

где р - неизвестное число, a l\(t) и lo(t) - неизвестные функции. Для определения этих неизвестных подставим (3.1.88) в (3.1.87):

-(kx + /0) = (2рх + li)(ax + ф/) - ^(2рх + k)2b2 + qx2. Приравнивая нулю коэффициенты при ж2, ж, ж0, получим уравнения:

2ра - р2Ъ2 + q = 0; ~h = (а - pb2)h + 2рфґ; -І0 = l^f - h2tb2.

Принимая во внимание, что в соответствии с (3.1.8)

убеждаемся в справедливости (3.1.82) и (3.1.84). 3.1.8 Задача о слежении

Пусть требуется, чтобы движение объекта (3.1.79) по переменным состояния было близко к некоторому желаемому движению, описываемому с помощью т - мерной вектор-функции хж(£) , задаваемой на интервале [t0, t] . Другими словами, x(t) должно следовать (или "следить") за хж(£) .

Мера близости вектор-функций x(t) и хж(£) определяется как значение функцио­нала

Таким образом, возникает задача о построении управления, при котором этот функ­ционал принимает наименьшее значение.

Покажем, что эта задача сводится к предыдущей [3.13]. Действительно, вводя но­вый вектор е = х — хж , получим, используя (3.1.79), уравнение

J = J(e'Q0e + u'u) dt. (3.1.92)

о

Если f^\t) обладает свойством (3.1.81), то оптимальное управление определяется соотношением (3.1.82).

3.1.9 Дискретные (цифровые) регуляторы

Пусть задан объект управления, описываемый разностными уравнениями

х(А; + 1) = Фх(/г) + Ru(k) (к = 0,1, 2,...) ж(0) = х(0\ (3.1.93)

где Ф и R - заданные матрицы чисел размеров пхп и п X т соответственно. Качество переходных процессов для этого объекта оценивается суммой

k=i

где Q - заданная положительно-определенная матрица. Требуется найти матрицы С (к) управления

и(к) = С'(к)х(к) [к = 0,1,2,...), (3.1.95)

при котором функционал (3.1.94) принимает наименьшее значение при любых .

Аналитическое конструирование регуляторов для дискретных объектов состоит [?] из операций:

(3.1.96)

1) вычисления матриц P(N — j) j = 1, N на основе рекуррентного соотношения P(N - j) = Ф'[д + P(N

нахождения

C'(N -j) = - {R'[Q + P(N -j + l)]R + Б}'1 xR'[Q + P(N - j + 1)]Ф (j = 1~N);

(3.1.98)

определения матрицы коэффициентов усиления регулятора

C\k) = C\N-j) (j = l,N). (3.1.99)

Вывод соотношений (3.1.96) . . . (3.1.99) для общего случая нестационарного дис­кретного объекта приведен в Дополнении 3.

Докажем эти соотношения при п = т = 1 . В этом случае объект (3.1.93) и функ­ционал (3.1.94) принимают вид

х(к + 1) = fx(k) + ги(к) (А; = 0,1,2,...); (3.1.100)

N

J =J2qx2(k) + u2(k). (3.1.101)

k=i

Для нахождения оптимального управления

и(к) = с(к)х(к) (3.1.102)

применим принцип оптимальности, рассмотренный в

2.3.

В соответствии с этим принципом независимо от того, как двигалась система до последнего шага (интервала [(N — 1), N] ), управление (u(N — 1)) на последнем шаге должно быть оптимальным (относительно состояния, возникшего в результате первых N — 1 шагов).

Частичная сумма, которую необходимо минимизировать на последнем шаге, имеет вид

J^"1) = qX2(N) + u2(N - 1) = q[fx(N - 1) + ru(N - l)]2 + u2(N - 1).  (3.1.103)
Используя необходимое условие экстремума этой суммы

Переходя к нахождению управления на предпоследнем шаге (интервале [N—2, N—1] запишем

Используя необходимое условие минимума управление на предпоследнем участке

Продолжая этот процесс, дойдем до j -то (от конца) участка (интервала [N—j, N—j-\-l] Частичная сумма, которую нужно минимизировать управлением u(N — j) , имеет вид

J(N~J) = qx2(N - j + 1) + u2{N - j) + v(N-j+V = = [q + p(N — j + l)]x2(N -j + l) + u2(N- j) = [q + p(N — j + l)][fx(N - j) + ru(N - j) + ru(N - j)]2 + u2(N - j)

(3.1.112)

Оптимальное управление

Эти уравнения следуют из (3.1.96),(3.1.98),если положить P(N—j) = P(N—j-\-l) = Р и обозначить Q + Р = Р .

Пример. Аналитическое конструирование дискретного (цифрового) ре­гулятора гирорамы. Пусть требуется найти цифровой регулятор

и(кТ) = clXl(kT) + с2х2(кТ) + с3х3(кТ) (к = 0,1, 2,...), (3.1.120)

при котором на движениях гирорамы, описываемой уравнениями (3.1.23) (при / = 0), минимизируется функционал

JV-»oo

J = е qiix\{kT) + q22x22(kT) + q33xl(kT) + и2(кТ). k=i

(3.1.121;

Переходя к численному решению этой задачи, сформируем вначале дискретную модель гирорамы. Для этого воспользуемся формулами (3.1.26), (3.1.28), с помощью которых вычислим матрицу Ф и вектор R. При значениях параметров гирорамы а22 = —400 , а23 = 103 , а32 = —10 , Ъ3\ = 10~2 получим при Г = 0, 015

Используя эти матрицы, а также значения параметров функционала (3.1.121), qu = 10 Q_22 = <?зз = 0 , получим на основе (3.1.96), (3.1.98), (??) искомые числа:

а = -0,686 • Ю5; с2 =-0,728 • 102; с3 =-0,414 • 104. (3.1.123) 3.1.10 Программное обеспечение и практикум

ГАММ А-директива: 111 (Аналитическое конструирование оптимальных регулято­ров).

Исходные данные:

а)         Уравнение объекта (3.1.1).(При анализе переходных процессов в оптимальной си-
стеме к правой части этого уравнения добавляется слагаемое Фі ,где f -вектор ступен-
чатых внешних возмущений).

б)         Матрица N уравнения регулируемых переменных в = Ах . (Регулируемые пе-
ременные используются для анализа переходных процессов).

в)         Весовая матрица для регулируемых переменных Q0 .Используя эту матрицу и
матрицу N ,найдем матрицу Q = NTQ0N функционала оптимизации (3.1.3)

в)Время моделирования переходных процессов. Результаты:

а)         Матрица С регулятора (3.1.2).

б)         Графики переходных процессов по регулируемым переменным.

Используя директиву 111 выполняется практикум Пр.2.1.0дна из его целей состоит в исследовании инженерных показателей (установившихся ошибок ,времени регулиро­вания,перерегулирования) оптимальных систем.Результаты этого исследования отра­жают известный факт,состоящий в том,что любой асимптотически устойчивой системы (3.1.1),(3.1.1),(имеющей ,в частности, "плохие" инженерные показатели )всегда можно построить неотрицательный функционал более общего,чем (3.1.3), вида

оо

 (где матрица L удовлетворяет неравенству Q — L(L)~XLT > 0 a L > 0 ), для которого эта система является оптимальной. МАТЛАБ-функции:

1) [С, Р, А] = lqr(A} В} Q} L} L) -синтез оптимального регулятора непрывной си­стемы (TQ-оптимизация).Исходные данные:матрицы объекта (3.1.1) и функционала (3.1.124).Результат:матрицы регулятора и уравнения Риккати,а также вектор (А) соб­ственных чисел матрицы А + ВС1 замкнутой системы.

Заметим,что,если функционал оптимизации имеет вид (3.1.124),то уравнение Рик­кати и матрица регулятора описываются выражениями

РА + А'Р - (РВ + L){L)-l{B'P + L') + Q = 0; (3.1.125)

C = -(PB + L)(L')-\ (3.1.126)

[С, Р, А] = dlqr(Phi} Р, Q} Р, L) -синтез оптимального регулятора дискретной си­стемы (3.1.93)- (3.1.95) при N -+ оо.

[Р, А,С",гг] = саге(А, В, Q) -решение уравнения Риккати (3.1.18),где гг - по­грешность решения (определения матрицы Р°).

[Р, A,C",rr] = care(A} Р, Q) -решение уравнения Риккати (3.1.118) для дискрет­ных ситем ,где гг - погрешность решения .

5)         [Р] = lyap(A} Q)-решение уравнения Ляпунова(3.1.62).


Авторы: 239 А Б В Г Д Е З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Э Ю Я

Книги: 268 А Б В Г Д Е З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Э Ю Я