4.3 Оптимальные стохастические дискретные системы

4.3.1 Оптимальное управление при измеряемом векторе состояния

Рассмотрим дискретный объект управления

х(& + 1) = Ф(к)х(к) + R(k)u(k) + 4?(k)f(k) (к = 0,1, 2,...), (4.3.1)

где f (&) - ц -мерный вектор внешних возмущений, являющийся последовательностью f (0) , f (1) , f (2) . . . некоррелированных стохастических величин с нулевым средним и матрицами дисперсии Вр-)(к) {к = 0,1,2,...)); Ф(к), Ф(к), R(k) (к = 0,1,2,...) — заданные матрицы.

Пусть задан критерий

J = М |^ х'(А;)д(А;)х(А;) + и'(к - 1)и(к - 1) + x'(iV)P(1)x(iV)| , (4.3.2)

где Q(k) (А; = 0,1,2,...),         - заданные положительно-определенные матрицы.

Требуется найти управление и(к) как функцию переменных состояния, при кото­ром функционал (4.3.2) принимает наименьшее значение.

Искомое управление, как и в непрерывном случае, совпадает с управлением, полу­ченным в

3.1 при отсутствии внешних воздействий. Сформулируем этот результат [3.11].

Утверждение. Оптимальное стохастическое управление дискретным объектом (4.3.1), при котором критерий (4.3.2) принимает наименьшее значение, имеет вид

и(к) = С'(к)х(к) (к = 0,1,2,...), (4.3.3)

где

С\к) = - {R'{k)[Q{k + 1) + Р(к + l)]R(k) + Emyl R'{k)[Q{k + 1) + Р(к + 1)]Ф(к).

(4.3.4)

Последовательность матриц Р(к) (к = 0,1,2,...) является решением матричного разностного уравнения

Р(к) = <S>'(k)[Q(k + l) + P(k + l)]№(k) + R(k)C"{k)] (к = N-1,N-2,...,1) (4.3.5) с конечным условием

A(N) = Р(1). (4.3.6)

Нетрудно видеть, что если подставить (4.3.4) в (4.3.5) и положить р(!) = 0, Ф(к) = Ф, R(k) = R, к = N - j , то (4.3.3) ... (4.3.6) совпадает с (3.1.96) ... (3.1.99).

В стационарном случае, когда матрицы, входящие в уравнения объекта (4.3.1), и функционал (4.3.2) постоянны, получим при N —У оо и функционале

J = lim ІМ \j2 ^(k)Q(k)*(k) + u'(k - l)u(k - 1)1 (4.3.7)

N U=i J

оптимальную систему

x(A; + 1) = Фх(/г) + Ru(k) (к = 0,1, 2,...); (4.3.8)

u(k) = C'x(k) (A; = 0,1,2,...), (4.3.9)

в которой матрица С определяется, как в детерминированном случае, соотношениями (3.1.98) ... (3.1.96).

4.3.2 Оптимальный дискретный наблюдатель ( дискретный фильтр Калмана-Бьюси)

Рассмотрим объект управления, описываемый уравнениями

х(& + 1) = Ф(к)х(к) + R(k)u(k) + 4?(k)f(k) (к = 0,1, 2,...), х(0) = х(0); (4.3.10)

у(к) = D(k)x(k) + Х(к) (А: = 0,1,2,...), (4.3.11)

где f (&) и %(£;) , (Л; = 0,1,2,...) - последовательности некоррелированных векторных стохастических величин с нулевым средним и заданными матрицами дисперсий R^(k) и RW(k) . Здесь

Пусть х(°) - случайный вектор, некоррелированный с векторами ї(к) и %(£;) , при этом

М{х(°)} = х<°), М{[х(0) - х(°)][х(0) - х<°)]'} = R{0\

где х^0) и R(°) известны.

Требуется найти уравнение устройства восстановления (наблюдения, фильтрации), выходами которого является оценка х(&) неизмеряемого вектора состояний х(&).

При этом критерий

J = М {е'(к)А(к)е(к)} , (4.3.12)

[ где Л(&) (Л; = 0,1,2,...) - заданные положительно - определенные матрицы, е(к) = х(&)—х(&) ] должен принимать наименьшее значение.

Утверждение. Оптимальный в смысле критерия (4.3.12) наблюдатель (устройство восстановления, фильтрации) для объекта (4.3.10), (4.3.11) описывается уравнением

х(А; + 1) = Ф(А;)х(А;) + К (к) [у (к) - D(k)±(k)} + R(k)u(k); х(0) = х(0) (4.3.13)

в котором матрицы К (к) (к = 0,1,2,...) определяются рекуррентными соотноше­ниями:

К (к) = ${k)Pe{k)D'{k) [pS2\k) + D{k)Pe{k)D'{k)\~l {к = 0,1,2,...); (4.3.14)

Ре(к + 1) = [Ф(к) - K(k)D(k)] РеФ'(к) + ^(k)R^(k)^'(k) (к = 0,1, 2,...) (4.3.15) при начальном условии

Ре(0) = Р(0). (4.3.16)

Начальное условие для наблюдателя (4.3.13)

х(0) = х<°) (4.3.17)

Матрицы Ре(к) размеров пхп являются матрицами дисперсий ошибки восстано­вления е(к) = х(&) — х(А;). Для оптимального наблюдения среднее значение

М{е'(А;)Л(А;)е(А;)} = tr[Pe(A;)A(A;)] (к = 0,1, 2,...). (4.3.18)

Доказательство этого утверждения аналогично непрерывному случаю [3.7]. Часто применяют оптимальные наблюдатели вида (4.3.13), в которых вместо у (А;) используется у(к + 1) . Такой наблюдатель описывается уравнениями

х(А;+1) = Ф(кЩк)+К(к+1) [у(к + 1) - D(k + І)Ф(кЩк) - D(k + 1)R(k)u(k)]+R(k)u(k),

(4.3.19)

где

Пример . Рассмотрим гирораму, описываемую уравнениями (3.1.23):

х\ = ж2, х2 = а22х2 + а23х3} х3 = а32х2 + а33х3 + Ъ31и + ф31/} (4.3.27)

с параметрами из примера 4.1.2 и ф31 = Ь31 = 10~3 , где fit) - случайный гауссов-ский процесс типа "белый шум" с нулевым математическим ожиданием и параметром ковариационной функции Ф1^ = 106 .

Пусть процесс измерения х\ датчиком угла прецессии сопровождается случайной гауссовской помехой \ типа "белый шум" с нулевым математическим ожиданием и параметром ковариационной функции Ф2^ = 104 .

Таким образом,

У = хг+Х. (4.3.28) Пусть начальное состояние гирорамы

Ж1(0) = ж2(0) = ж3(0) = 0. (4.3.29)

Требуется построить наблюдатель (фильтр) переменных х\ , ж2 , ж3 , восстанавли­вающий значения этих переменных в моменты времени Т , 2Т , ЗТ , . . ., кТ , при Т = 0, 01 . При этом сумма дисперсий ошибок восстановления

J = М {[хгікТ] - ЫкТ)]2 + [х2(кТ) - х2(кТ)}2 + [х3(кТ) - ж3(А;Г)]2} (4.3.30)

должна быть наименьшей для каждого момента времени кТ .

Переходя к решению этой задачи, запишем дискретную модель гирорамы

4.3.3 Теорема разделения

Рассмотрим объект управления, описываемый уравнениями (4.3.10), (4.3.11). Пусть требуется найти управление, зависящее от измеряемого вектора у выходов объекта, такое, чтобы на движениях объекта минимизировался функционал

N

J = М { Е ^(k)Q(k)^(k) + и'(к - 1)и(к - 1) + x'(iV)P(1)x(iV) j, (4.3.38)

.к=1

где Q(k) и Р^ - заданные положительно-определенные матрицы.

Как и в непрерывном случае, решение этой задачи удовлетворяет принципу разде­ления.

Утверждение. (принцип разделения). Оптимальное в смысле функционала (4.3.38) стохастическое управление объектом (4.3.10), (4.3.11) имеет вид

и(к) = С"(к)х(к) (к = 0,1,2,...), (4.3.39)

где С'(к) (к = 0,1,2,. . .) - последовательность матриц коэффициентов, определяе­мая соотношениями (4.3.4) ... (4.3.6), которые получены для оптимального в смысле функционала (4.3.38) стохастического управления при полностью измеряемом век­торе состояния объекта (4.3.10); вектор х(&) - n-мерный вектор переменных состо­яния оптимального в смысле функционала (4.3.12) наблюдателя (4.3.13), матрицы К (к) коэффициентов которого определяются из соотношений (4.3.14), (4.3.15). До­казательство этого утверждения аналогично непрерывному случаю.

В стационарном случае управление объектом (4.3.22) имеет вид

и(к) = С'х(к) (4.3.40)

где матрица С определяется, как и в детерминированном случае, соотношениями (3.2.4) ... (3.2.8), а вектор х(&) является выходом (4.3.23), в котором матрица К находится из соотношений (4.3.24) ... (4.3.26).

Пример. Построим оптимальный цифровой регулятор гирорамы, описываемой уравнениями (4.3.31), (4.3.32). Оптимальность цифрового регулятора понимается в том смысле, чтобы на движениях гирорамы, замкнутой этим регулятором, минимизи­ровался функционал

В соответствии с принципом разделения искомый оптимальный регулятор описы­вается уравнениями (3.1.120), (4.3.33) ... (4.3.35).

Параметры этих уравнений были определены ранее: параметры управления (3.1.120) были получены в примере 4.1.3 в результате решения задачи оптимизации при от­сутствии внешних воздействий и измеряемых х\ , х2 , ж3 , а параметры наблюдателя (4.3.33) ... (4.3.35) были определены в предыдущем подпараграфе в результате решения задачи восстановления неизмеряемых переменных ж2 и ж3 .

Приведенные в этой главе результаты были вначале получены при целом ряде ограничений: 1) внешние воздействия и помехи являются гауссовскими случайными процессами типа "белый шум"; 2) внешние воздействия и помехи взаимно незави­симы (некоррелированы); 3) матрицы R^(t) и R^(t) - невырождены (положительно-определенны) и т. д.

К настоящему времени многие из этих ограничений сняты [?], [?]. Так, разработаны алгоритмы оптимального стохастического управления, когда векторы f и % коррели-рованы, а матрица R^2\t) вырождена.

Когда внешние воздействия и помехи являются не "белыми шумами", а гауссов-скими случайными процессами с корреляционными матрицами, не содержащими дельта-функций (цветные шумы), то такие процессы моделируют как результат прохождения случайного процесса типа "белый шум" через линейную динамическую систему. В частности, для непрерывного случая это означает, что

f(t) = L(1)(t)z + f(t); X(t) = LW(t)z + x(t);

(4.3.42)

z = A(t)z + £(t), (4.3.43)

где f (t), x(t) і i{t) - гауссовские случайные процессы типа "белый шум"; матрицы L^l\t) , L^2\t) , A(t) определяются по заданным корреляционным матрицам процессов

т и x(t).

Уравнения (4.3.42), (4.3.43) называются уравнениями формирующего фильтра. Объединяя уравнения (4.2.1), (4.2.2) с уравнениями формирующего фильтра, полу­чим систему

возбуждаемую случайными процессами типа "белый шум".

4.3.4 Программное обеспечение

МАТЛАБ-функции:

[kest, К} РЄ} Z} Z] = kalman(Phi} R} D} E} Ф, i?1, R2) -синтез и формирование опти­мального дискретного фильтра Калмана (4.3.23),где Z и Z - ковариационные матрицы ошибок оценивания.

[rlqg] = lqgreg(kest} С) -формирование LQG -регулятора (линейно-квадратического гауссова регулятора)путем соединения дискретный фильтра Калмана и матрицы С вычисляемой с помощью функции dlqr .


Авторы: 239 А Б В Г Д Е З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Э Ю Я

Книги: 268 А Б В Г Д Е З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Э Ю Я