1.3 Развитие понятий оптимального управления

1.3.1 Стабилизирующее управление при внешних возмущениях

Причиной возмущенного движения часто является неполнота знаний о внешних воздействиях на объект управления в его программном движении. Уравнения (1.1.1) при учете внешних возмущений имеют вид

х = у>(х, u, f, t) (1.3.1)

где fit) - ц -мерный вектор внешних воздействий.

Будем полагать, что эти функции имеют две составляющие: известную - f*(t) (і = 1,/і) и неизвестную - Sfi(t) (І = 1,/і) .

Повторяя изложенное в 1.2, получим уравнения возмущенного движения с учетом внешних воздействий.

В первом приближении эти уравнения имеют вид

В зависимости от объема информации о функциях Sf*(t) можно различить три случая:

а)         полная информация (это означает, что функции известны заранее; тогда, в част-
ности, они могут быть включены в состав fi(t) (і = 1,/і) либо они точно измеряются
в процессе движения объекта);

б)         Sfi(t) (і = 1,/і) - случайный процесс с известными статистическими характери-

в) отсутствует какая-либо информация о функциях Sfi(t) (і = 1,/і), однако из­вестно, что они ограничены некоторыми известными числами <^/(|^/i(t)| < 8fi, і = 1, /і) .

В зависимости от объема информации о внешних воздействиях можно различить следующие типы оптимальных систем: а) равномерно-оптимальные; б) статистически оптимальные; в) минимаксно-оптимальные [1.4].

Стабилизирующее управление для систем первого типа находится из условия ми­нимума функционала (1.2.9) на решениях системы (1.3.2). В системах второго типа каждой реализации внешнего воздействия соответствует при известных управлениях (1.2.10) свое значение интеграла (1.2.9), и поэтому в качестве меры эффективности ста­билизирующих управлений используется математическое ожидание этого интеграла

1.3.3)

Физический смысл величины Ji состоит в том, что случайные воздействия возбу­ждают случайное движение по ординатам 8xi(t) (і = l,n) . Если вычислить значение интеграла (1.2.9) для каждой реализации случайного движения и затем определить "среднеарифметическое", то получим значение J\ . Управление, при котором J\ до­стигает минимума, является оптимальным в среднем, и поэтому система стабилизации называется статистически оптимальной.

При отсутствии информации о внешних воздействиях используется игровой подход к определению оптимального управления. В соответствии с этим подходам функции 3fi(t) і} = 1, А*) считаются "управлениями" и определяются из условия максимизации интеграла (1.2.9), а управления 8 и kit) {к = 1,ш) - из условия его минимизации. Эти управления обеспечивают наилучший результат при наихудшем внешнем воздействии [минимум максимального значения функционала (1.2.9)], и поэтому системы с таким управлением называются минимаксно-оптимальными.

1.3.2 Общий вид уравнений стабилизирующего управления

В общем случае стабилизирующие управления описываются не алгебраическими уравнениями (1.2.10), а дифференциальными уравнениями вида

где xp(t) - пр -мерный вектор переменных состояния устройства управления (ре­гулятора), (,Cp(xp, $х, t) , Гр(хр, $х, t) - пр— и т -мерные векторы соответственно.

В ряде случаев не все переменные состояния объекта управления доступны непо­средственному измерению.

Пусть измеряются некоторые переменные j/i(t),. . ., yr(t) , связанные с переменными объекта соотношениями

У = w(£x, t), (1.3.6)

где y(t) - г—мерный вектор измеряемых переменных; w($x, t) - заданный г—мерный вектор. В этом случае уравнения регуляторов имеют вид

Далее будем опускать символ 8 в соотношениях (1.2.2) ... (1.2.5)), (1.2.9), (1.2.10), относящихся к системам стабилизации. Если теперь для общности изложения заме­нить функцию под интегралом (1.2.9) функцией <р0 , то модели объекта управления и модели целей управления (критерии качества управления) в системах программного

управления и стабилизации будут совпадать. Это естественно, так как с математиче­ской точки зрения несущественно происхождение этих моделей.

Используя матричную форму, запишем также, отбрасывая символ 8, уравнения (1.3.2) первого приближения и уравнение (1.2.14) для регулируемых переменных:

где Ait), Bit), Ф(£) , Nit) - матрицы, элементами которых являются известные функ­ции времени. Эти матрицы имеют размеры пхп , n X m , nx/л, тхп соответственно.

Связь (1.3.6) переменных состояния объекта с измеряемыми переменными часто может быть линеаризована и тогда она с учетом помех измерения принимает вид

y = D(t)x + X(t), (1.3.10)

где x(t) ~ г-мерный вектор помех измерения; Dit) - заданная матрица размеров п X г .

Устройство управления (регулятор) часто описывается не уравнениями (1.3.7) ... (1.3.8), а линейными уравнениями вида

где Apit), Bpit), Dpit), Fpit) - матрицы размеров np x np , np x r } m x np , m x r соответственно.

Часто регулятор содержит управляющую ЭВМ. В этом случае он описывается раз-

ностными уравнениями:

где Т - интервал дискретности регулятора; Фр(кТ)} Rp(kT)} Dp(kT)} Fp(kT)} (А; = 0,1, 2,. . .) - матрицы чисел соответствующих размеров. Поскольку для работы регулятора (1.3.13) ... (1.3.15) достаточно измерения вектора у лишь в дискретные моменты вре­мени О, Т, 2Т, ЗГ ит. д., то естественно при определении параметров дискретного регулятора использовать дискретную модель объекта (1.3.9), (1.3.10). Такая модель при f (t) = %(t) = 0 имеет вид

Матрицы Ф(кТ) и R(kT), нетрудно построить на основе матриц Ait), и Bit), если воспользоваться формулой Коши

где Hit,t0) - нормированная фундаментальная матрица. Эта матрица (размеров пхп) составлена из п — мерных векторов (первый вектор - это решение однородного уравнения х = A(t)xp при начальных условиях Xi(t0) = 1, x2(to) = ... = xn(t0) ; второй вектор является решением однородного уравнения при начальных условиях xi(t0) = 0, x2{t0) = 1, ж3(^о) = . . . = xn(t0) = 0, и т.д.).

Произведение Я(^,т)Я(т) -это импульсная переходная матрица объекта. Ее можно получить экспериментально, прикладывая (в момент т ) к входам объекта 8 -импульсы.

Полагая в (1.3.18) t = (к + 1)Г, t0 = кТ и принимая во внимание (1.3.15), получим

где Q(kT) (к = l,N) - заданные положительно-определенные матрицы чисел.

В стационарном случае, когда параметры объекта не изменяются во времени, его уравнения (1.3.9) записываются как

х = Ах + Ви + Фі, в = ЛГх,

1.3.22)

где А, В , Ф , N - заданные матрицы чисел.

Дискретная модель объекта, описываемого уравнениями (1.3.22), имеет (при / = 0 вид

Соотношения (1.3.23) ... (1.3.25) нетрудно доказать, если принять во внимание, что в стационарном случае можно указать явный вид нормированной фундаментальной матрицы H(t,t0) = еА(*~*°)

Если измеряемые переменные и управления являются скалярными функциями вре­мени (г = т = 1) , то объект (1.3.9), (1.3.10) называется одномерным объектом. Ис­ключая вектор состояния х из уравнений

х = Ах + би, у = о?х, получим уравнение одномерного объекта в форме "вход-выход"

1.3.26)


Авторы: 239 А Б В Г Д Е З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Э Ю Я

Книги: 268 А Б В Г Д Е З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Э Ю Я