3.2 Построение регуляторов при неполной информации о векторе состо­яния

Постановка задачи восстановления (наблюдения)

Рассмотрим объект управления, возмущенное движение которого описывается урав­нением

х = A(t)x + B(t)u, х(*о) = х(°), (3.2.1)

и пусть в результате синтеза получено оптимальное управление

u = C"(t)x. (3.2.2)

Реализация этого управления часто затруднена тем обстоятельством, что не все переменные состояния объекта доступны непосредственному измерению, а можно из­мерить лишь компоненты некоторого г -мерного вектора у , связанные с переменными состояния соотношением

у = 1>(*)х. (3.2.3)

В связи с этим возникает задача восстановления (наблюдения, оценки) вектора x(t) по результатам измерения y(t) на интервале [t0, t] . После того как вектор состояния восстановлен, можно реализовать управление (3.2.2), заменяя в нем действительное состояние восстановленным вектором состояния.

Уравнение наблюдателя

Будем называть наблюдателем физическое устройство, на вход которого подается реальный вектор управления uit), действующий на объект, а его выходами служит оценка вектора состояния объекта.

Простейшим наблюдателем является физическое устройство, описываемое уравне­нием

і = A(t)x + B(t)u, x(t0) = x(0), (3.2.4)

где x(t) - n -мерный вектор состояния (выхода) наблюдателя, х^0) - начальное состо­яние наблюдателя.

Уравнение (3.2.4) описывает физическую модель объекта, функционирующую в ре­альном времени.

Если начальное состояние объекта известно, то принимая х^0) = х^0) , получим одинаковые решения уравнений (3.2.4) и (3.2.1), и следовательно, наблюдатель точно восстанавливает вектор состояния объекта.

Начальное состояние объекта обычно неизвестно, и поэтому х^0) ф х^0) . Тогда возникает ошибка восстановления е = х — х. Она удовлетворяет уравнению

e = A(t)e; e(t0) = х<°) - х(°), (3.2.5)

которое получается, если из уравнения (3.2.1) вычесть уравнение (3.2.4).

Если объект управления асимптотически устойчив, то ошибка восстановления обла­дает свойством lim e(t) = 0 и следовательно, выход наблюдателя будет с течением времени приближаться к вектору состояния объекта.

Если объект управления неустойчив, то применяется наблюдатель, описываемый уравнением

где Kit) - некоторая матрица размеров п X г , называемая далее матрицей коэффи­циентов усиления наблюдателя.

В этом наблюдателе сравнивается измеренное значение вектора у с восстановлен­ным значением D(t)~k . Эта коррекция по ошибке восстановления усиливается матри­цей Kit) . При Kit) = 0 наблюдатель (3.2.6) совпадает с простейшим.

Запишем уравнение наблюдателя в виде

х = [A{t) - K{t)D{t)] х + K{t)y + B(t)u, (3.2.7)

из которого следует, что входом наблюдателя является вектор управления и вектор из­меряемых переменных, а переходные процессы определяются матрицей [Ait) —Kit)Dit)] и поэтому матрица Kit) должна выбираться из условия асимптотической устойчиво­сти наблюдателя.

Вычитая уравнение (3.2.1) и (3.2.6), получим следующее уравнение для ошибки восстановления

ё = [A(t) - K(t)D(t)] е; e(t0) = х<°) - х(0). (3.2.8)

Если существует матрица Kit) наблюдателя, такая, что наблюдатель асимптоти­чески устойчив, то ошибка восстановления обладает свойством lime(t) = 0 .

Существует несколько методов построения матрицы Kit) , при которой наблюда­тель асимптотически устойчив.

Рассмотрим два таких метода, ограничиваясь, для простоты, стационарным объек­том.

В этом случае объект описывается уравнением

х = Ах + Би, у = Г/х, (3.2.9) и наблюдатель (3.2.6) имеет вид

х = Ах + К [у — Z)x] + Ви, x(t0) = x(0), (3.2.10)

где К - матрица чисел.

Будем здесь и далее полагать, что объект (3.2.9) полностью наблюдаем. Это озна­чает, что

ранг

3.2.3 Построение наблюдателя на основе уравнения Риккати

Характеристический полином наблюдателя (3.2.10) имеет вид

DH(s) = det \\Es - А + KD\\. (3.2.12)

Задача состоит в том, чтобы построить матрицу К так, чтобы корни этого поли­нома имели отрицательные вещественные части.

В разделе 3.1.1 было показано, что решение задачи АКОР обеспечивает асимптоти­ческую устойчивость системы (3.1.1), (3.1.2). Поэтому задачу о построении матрицы К сведем к специальным образом построенной задаче АКОР.

В связи с этим запишем полином (3.2.12) как

DH(s) = det \\Es - A' + D'K\\ (3.2.13) и сформируем вспомогательную "систему" управления с этим характеристическим по-

линомом

где jiit) - n-мерный вектор состояния "системы". Эта "система" выражает двойствен­ность задач управления и наблюдения.Она совпадает с системой (3.1.1), (3.1.2),если положить А = А1 }В = D', С = —К .

Уравнение Риккати (3.1.15) для этой системы имеет вид

РСА' + АРС - PCD'DPC + Qc = 0 (3.2.16)

где Qc - заданная положительно-определенная матрица, Рс - искомая матрица раз­меров пхп.

Решая это уравнение, найдем положительно определенную матрицу Pj°) и в соот­ветствии с (3.1.16) сформируем искомую матрицу

К = РС(0)Р/. (3.2.17)

3.2.4 Построение наблюдателя на основе модального управления

Если при построении матрицы К требуется нечто большее, чем асимптотическая устойчивость, а именно, требуется найти такую матрицу К , чтобы корнями характери­стического полинома наблюдателя DH(s) являлись заданные числа А",. . ., A" (Re А" < 0 , і = 1,п) . Последнее означает, что матрица К должна удовлетворять следующему то­ждеству ПО s

Для построения такой матрицы К воспользуемся двойственностью задач упра­вления и наблюдения, выраженной системой (3.2.14), (3.2.15), и применим модальное управление [3.25], [3.26] .

Задача модального управления заключается в следующем.

Для заданного полностью управляемого объекта

х = Ах + Ри    (3.2.19)

найти матрицу С закона управления

и = С'х,           (3.2.20)
такое, что корни (моды) характеристического полинома замкнутой системы

имеют наперед заданные значения Ai,. . . , Хп .

Процедура построения матрицы С разрещающей эту задачу, приводится в Допол­нении 4. Для построения матрицы К, заменим в уравнении (3.2.19) матрицы А ж В матрицами А' и полагая Аг- = А" і = 1,п) найдем матрицу С", тогда искомая матрица наблюдателя

К = -С (3.2.22)

Пример. Определение матрицы наблюдателя гирорамы. Уравнения наблю­дателя полного порядка для переменных состояния гирорамы, описываемой уравнени­ями (??), (??), имеют в соответствии с (3.2.10) вид:

х1 = Хі + кц(у - жі); ж2 = а22ж2 + а23х3 + к2\{у - Жі); ж3 = а32х2 + а33ж3 + к31(у - хх) + Ъ31и.

(3.2.23) (3.2.24) (3.2.25)

Неизвестные параметры кц , к2\ , к3\ определим так, чтобы корни характеристи­ческого уравнения наблюдателя имели наперед заданные значения А" , А" , А" . В связи с этим сформулируем задачу модального управления: для "объекта"

при котором характеристический полином системы (3.2.26), (3.2.27) имеет вид

В соответствии с первой операцией процедуры построения модального управления формируем матрицу

Используя затем преобразования (Дп.4.14) с матрицей (3.2.30), получим значения Сі (г = 1,2,3), тогда искомые

ки = -а (г = 1,2,3). (3.2.33) 3.2.5 Структура системы с наблюдателем

Возвращаясь к рассмотрению системы (3.2.1), (3.2.2), реализация закона управле­ния (3.2.2) которой затруднена тем, что не все переменные состояния доступны непо­средственному измерению, отметим, что в этом случае естественно использовать на­блюдатель (3.2.6), а затем воспользоваться законом управления (3.2.2) применительно к восстановленному состоянию.

Полученная таким образом система описывается уравнениями:

х = A(t)x + B(t)u, y = L>(t)x; (3.2.34) х = [A(t] + K(t)D(t)} x + K(t)y + B(t)u; (3.2.35)

u = C"(t)x. (3.2.36)


На рис. 3.2.1 приведена структурная схема системы с наблюдателем, построенная на основе уравнений (3.2.34) ... (3.2.36).

Рис. 3.2.1

Исследуем устойчивость системы (3.2.34) ... (3.2.36). Осуществим эквивалентные преобразования этой системы. Вычитая из первого уравнения системы (3.2.34) урав­нение (3.2.35) и заменяя в (3.2.36) х = х — е , получим после подстановки (3.2.36) в (3.2.34) уравнения:

e = [A(t) + K(t)D(t)]e; e(t0) = x(t0)-x(to); (3.2.37)

x = [A(t) + B(t)C'(t)] x - B(t)C'(t)e; x(t0) = x

(o)

(3.2.38)

Если матрица коэффициентов усиления наблюдателя Kit) выбрана так, что наблю­датель (3.2.35) асимптотически устойчив при y(t) = wit) = 0 , то решение уравнения (3.2.37) e(t) —У 0 при t\ —У оо независимо от начального состояния e(t0) .

Пусть матрицы Bit) и С it) , входящие в уравнение (3.2.38), ограничены и e(t) —У оо при t —У оо , тогда x(t) —У 0 , если асимптотически устойчива система

х = [A(t) + B(t)C'(t)]x. В стационарном случае система (3.2.34) ... (3.2.36) имеет вид

Эквивалентная ей система, аналогично (3.2.37), (3.2.38), записывается как

ё = [А - KD] е; х = [А + ВС'] х - ВС'е. Характеристический полином системы (3.2.43)

(3.2.43)

Из этого выражения следует, что корни характеристического полинома оптималь­ной системы с наблюдателем состоят из корней характеристического полинома Du(s) = det (Es — А — ВС) оптимальной системы (у которой все переменные состояния до­ступны непосредственному измерению) и корней характеристического полинома Du(s) det (Е — А + KD) наблюдателя. Таким образом, можно производить раздельное по­строение закона управления и наблюдателя.

Пример. Гирорама с наблюдателем . Рассмотрим при /і = 0 гирораму (3.1.23) с оптимальным в смысле функционала (3.1.25) управлением (3.1.24) В связи с тем что непосредственному измерению доступна лишь одна переменная состояния х\ , восполь­зуемся для восстановления остальных неизмеряемых переменных состояния наблюда­телем (3.2.1) ... (3.2.3) Тогда гирорама с наблюдателем будет описываться уравнениями

в которых (3.2.46) ... (3.2.48) - уравнения регулятора, параметры которого С\ , с2 , с3 определяются решением задачи об оптимальном управлении, описанным в примере 4.1.2, а параметры кц , к2\ , к3\ находятся в результате построения наблюдателя, рассмотренного в примере 4.2.3.

Характеристический полином системы (3.2.45), (3.2.46), если положить в (3.1.24) Хі = Xi (г = 1, 2, 3) имеет вид

характеристический полином наблюдателя

DH(s) = s3 + d*s2 + d*ts + d*0, а характеристический полином системы (3.2.45) ... (3.2.48)

(3.2.50)

D(s) = Du(s)Dn(s).

(3.2.51)

3.2.6 Возможная негрубость системы с наблюдателем

Будем называть асимптотически устойчивую систему грубой, если она сохраняет асимптотическую устойчивость при малых изменениях коэффициентов, описывающих ее дифференциальных уравнений.Одним из показателей грубости системы являются [3.24] запасы устойчивости по фазе и модулю.

Исследуем запасы устойчивости системы (3.2.40) - (3.2.42) и покажем, что они могут быть недопустимо малыми [3.14],[3.15],[3.16].

Исключая вектор состояния регулятора х, запишем его уравнения как

и = С (Es — А + KD)'1 [Ку + Ви]

или

[Е -C"(Es-A + KD)-1 В] и = С" (Es - А + KD)'1 Ку. (3.2.52)

Сформируем передаточную матрицу — Wpa3(s) системы (3.2.40), (3.2.52) в разо­мкнутом (на входе объекта) состоянии. Для этого заменим вектор входа объекта на некоторый вектор —г (и = —г, что означает размыкание системы на входе объекта, и запишем матрицу, связывающую выход регулятора и с вектором г . Тогда получим

Ограничиваясь далее, для простоты, случаем скалярного управления (т = 1) , запишем передаточную функцию

Её можно представить как

с' (Es - A) bDH(s) + c'(Es-A + KD) bd(s

Wpa3 5 = —   —7      \           —, 3.2.55

P          d(s)Dn(s)-c,(Es-A + KD)hd(s)

где символ     означает присоединенную матрицу, d(s) и DH(s) - характеристи-

ческие полиномы объекта и наблюдателя.

Действительно, представляя матрицу в числителе передаточной функции (3.2.54)

как

Нетрудно видеть, что её числитель и знаменатель содержат одинаковые полиномы p{s) = с' (^Es — А + KDj hd{s) , которые взаимно сокращаются в характеристическом

полиноме системы D{s) = ^d(s) — с' (^Es — A^j bj DH(s) + p{s) — p{s).

Если коэффициенты объекта отличаются от расчетных, полиномы p{s) в чмсли-теле и знаменателе различаются. Так, в частности, вектор b , входящий в полином числителя относится к объекту, а вектор b в знаменателе формируется в устройстве наблюдения.

В [3.24] показано, что взаимное уничтожение полиномов при построении характе­ристического полинома является (при больших значениях коэффициентов полинома p(s)) признаков малых запасов устойчивости по фазе и модулю. Там же приведены примеры малых запасов устойчивости систем с наблюдателями.

3.2.7 Построение грубых систем с наблюдателем.

Если вектор состояния объекта измеряется, то регулятор (3.2.1), оптимальный в смысле функционала (3.1.3) обеспечивает грубость системы. Как показано в следую­щем разделе запасы устойчивости по фазе и модулю оптимальной системы достаточно велики.

Передаточная матрица разомкнутой (по входу объекта) такой оптимальной системы имеет вид

Wpa3{s) = -С" {Es - А)'1 В. (3.2.56)

В связи с возможной негрубостью такой системы с наблюдателем возникает во­прос: нельзя ли выбрать матрицу К наблюдателя так, чтобы передаточная функция системы с наблюдателем была близка к её передаточной матрице без наблюдателя

W^3(s) = Wpa3{s). (3.2.57)

Оказывается, что для минимально-фазовых объектов это возможно.

Объект (3.2.40) при г = т называется минимально-фазовым, если корни полинома det D (yEs — А) В имеют отрицательные вещественные части.

Будем определять матрицу К наблюдателя на основе уравнений(??), (??), в по­следнем из которых матрица Qc имеет определенную структуру, и таким образом

К = Ре(0)Р', (3.2.58)

где неотрицательно-определенная матрица Pj°) является решением следующего урав­нения Риккати

РеА' + АРе - PeD'DPe + R + pBVBT = 0, (3.2.59)

где R и V - произвольные неотрицательно-определенные матрицы, (3 - достаточно большое положительное число, которое назовем коэффициентом сближения.

Утверждение. [3.15] . При р —У оо передаточная матрица Wpa3(s) системы с наблюдателем приближается к передаточной матрице И/раз(з) системы без наблю­дателя.

3.2.8 Программное обеспечение и практикум

ГАММ А-директива: 113 (Оптимальная система с наблюдателем). Исходные данные:

а)         Уравнение объекта (3.1.1).(При анализе переходных процессов в оптимальной си-
стеме к правой части этого уравнения добавляется слагаемое Фі ,где f -вектор ступен-
чатых внешних возмущений).

б)         Матрица D уравнения измеряемых переменных,которые совпадают с регулиру-
емыми: в = у. (Регулируемые переменные используются для анализа переходных
процессов).

в)         Весовая матрица для регулируемых переменных Q0 .Используя эту матрицу и
матрицу N ,найдем матрицу Q = NTQ0N функционала оптимизации (3.1.3)

г)         Неотрицательная матрица V в уравнении Риккати (3.2.59)для наблюдателя.(Эта
матрица названа матрицей Доула )

д)         Положительный параметр р, на которое умножается эта матрица.

а)         Матрицы С и К регулятора (3.2.41),(3.2.42)

б)         Графики переходных процессов по регулируемым переменным.

Используя директиву 113 выполняется практикум Пр. 2.2.0 дна из его целей состоит в исследовании инженерных показателей (установившихся ошибок ,времени регулиро­вания,перерегулирования) системы в зависимости от параметра р .

МАТЛАБ-функции:

est = estim(A} В} D} D} К) -формирование наблюдателя (3.2.10),где D-матрица при управлении в измеряемом сигнале: у = Dx + Du .

rsys = reg(A} B} D} D} С", К) -формирование регулятора (3.2.41),(3.2.42

А" = place(A'} D1} А) -расчет коэффициентов наблюдателя на основе модального управления.

[Рс, А, К} rr] = care(A'} D', Qc) -расчет коэффициентов наблюдателя на основе урав­нения Риккати (3.2.16).


Авторы: 239 А Б В Г Д Е З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Э Ю Я

Книги: 268 А Б В Г Д Е З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Э Ю Я