2.1 Принцип максимума

Развитие систем управления, ужесточение требований к их точности при ограни­ченных габаритах и ресурсах привело в 40-50-х годах к использованию вариационного исчисления для построения оптимальных систем управления. Вначале использовались методы классического вариационного исчисления, однако вскоре стало ясно, что для построения систем новой техники (в частности, систем запуска ракет [2.19]), систем, оптимальных по быстродействию, и т. п., необходимо дальнейшее развитие вариацион­ного исчисления и создания математической теории оптимального управления. Дело в том, что из-за ограничений на управления (например, ограниченным количеством то­плива ракеты, наличием [упоров/, рулей управления и т. п.) оптимальные управления оказались кусочно-непрерывными функциями с точками разрыва первого рода, число которых неизвестно. Это противоречило предположению классического вариационного исчисления о непрерывности экстремалей.

Этапом в развитии теории оптимального управления в нашей стране явилась общая постановка проблемы об оптимальном управлении, предложенная в 1954 г. сотрудни­ком Института автоматики и телемеханики АН СССР проф. А. А. Фельдбаумом на со­вместном семинаре инженеров и математиков, руководимом акад. Л. С. Понтрягиным. В 1956-1960 гг. Л. С. Понтрягиным и его учениками была разработана математическая теория оптимальных процессов, подытоженная в их всемирно известной монографии [2.7]. Основным результатом этой теории является "принцип максимума", указыва­ющий необходимые условия оптимальности для широкого круга задач оптимального программного управления.

2.1.1 Задача об оптимальном программном управлении

Пусть объект управления описывается уравнением

x = y>(x, u). (2.1.1)

Управления u\(t),. . . ,um(t) при каждом t принимают значения из некоторого за­мкнутого множества U. В качестве такого множества, часто далее будем иметь в виду множество, описываемое неравенствами

Назовем допустимыми управлениями те uk(i) (к = 1,га), которые являются кусочно-непрерывными функциями и принимают значения из множества U.

Среди допустимых управлений, переводящих объект (2.1.1) из заданного состояния

1.1 функции (р0 и (fi (г = 1, п) не явно зависят от t. Последнее (стационарность объекта) не снижает общности рассмотрения, так как в противном случае, вводя новую переменную xn+i = t и дополняя систему (2.1.1) уравнением xn+i = 1, получим систему, правая часть которой не зависит явно от t.

Введем вспомогательные переменные фі(і) (і = 0, п) , которые являются решением следующей системы дифференциальных уравнений

Переменные фі(і) (і = 0,п) часто называют вспомогательными переменными, а уравнения (2.1.6) для их определения называют сопряженной системой.

Запишем теперь уравнения (2.1.1), (2.1.6), в более компактной форме. Для этого введем в рассмотрение функцию Н переменных Xiit),. . ., xn(t), V'o(t), • • • }фп(і) и . . .,um(t).

Я(х, ф, фо, u) = ^Vw(x, u), (2.1.7)

i=0

используя которую представим (2.1.1), (2.1.6), как

2.1.2 Принцип максимума

Учтем теперь ограничения (2.1.2) на управление. Если в процессе оптимального управления функции и kit) (к = 0,ш) не достигают границ множества (2.1.2) (что означает |^(t)| < и*к (к = 0,ш), то для них выполняются соотношение (2.1.10). Однако часто оптимальное управление принимает граничные значения и*к либо — и*к (к = 0, га), более того, оптимальное управление может скачком переходить с одной гра­ницы на другую. Такие управления уже являются кусочно-непрерывными функциями времени.

При попадании оптимального управления на границу множества U соотношение (2.1.10), нарушаются. Оптимальные управления удовлетворяют в этом случае прин­ципу максимума Л. С. Понтрягина, установленного и доказанного в форме приведенной ниже теоремы.

Переходя к этой теореме, сделаем некоторые пояснения. Возьмем произвольное до-
пустимое управление u(t) и при начальных условиях     x0(t0) = 0 найдем решение
системы (2.1.1): x\(t\),. . ., xn(t).

Подставляя это решение и управление u(t) в (2.1.6), определим, пока при не­которых произвольных начальных условиях rji(t0}) решение (2.1.6): фі(і),. . ., фп(і). При фиксированных (постоянных) значениях векторов х и ф функция Н стано­вится функцией вектора и Є U. Максимум этой функции по и и обозначим через М(х, V, ^о) :

М(х, ф, фо) = тахЯ(х, ф, ф0, и). (2.1.11)

Максимум (наибольшее значение) непрерывной функции Я(х, ф} ф0} и) может достигаться как в точках локального максимума этой функции, в которых

дН       т д2Н

так и на границах и*к и — и*к (к = 1,ш), множества U.

Теорема (принцип максимума Л. С. Понтрягина [?]). Пусть u(t), t0 < t < t\ - такое допустимое управление, что соответствующие ему решения Xi(t) (і = 0,n) уравнения (2.1.8), исходящие в момент t0 из состояния (2.1.3), проходят в момент времени t\ через точку ж^1), x0(ti). Для оптимальности управления (при котором x0{ti) принимает наименьшее значение) необходимо существование таких ненулевых непрерывных функций V'o(t), фі(і),. . ., V'n(t), удовлетворяющих уравнениям (2.1.9), что при любом t (t0 < t < t\) функция i7(x(t), ф(і), V'o(t), u) переменного u Є U достигает при u = u(t) максимума

Я(x(t), ф(і), ф(і), u(t)) = M(x(t), ф(і), ф(і)) (2.1.13) при этом в конечный момент времени ti выполняются соотношения

V>o(ti) < 0; M(x(ti), V(ti), Ф{іі)) = 0 (2.1.14)

Если x(t), ф(і), и u(t) удовлетворяют (2.1.8), (2.1.9) и (2.1.13), то функции фо(і) и M(x(t), ф(і), ф(і) переменного t являются постоянными и поэтому проверку соотношений (2.1.14) можно проводить не обязательно в момент времени ti, а в любой момент t (t0 < t < ti).

Доказательство теоремы является достаточно сложным, и поэтому в разделе Дока­зательство 1 приведен лишь вывод основного соотношения (2.1.13) теоремы для случая свободного правого конца ( ж^1) не задан) и фиксированного t\.

Соотношения (2.1.13) и (2.1.14) можно записать в более простой форме:

тахЯ(х, ф, фо, и) = 0 (2.1.15)

Таким образом, центральным в теореме является условие максимума (2.1.15). Оно означает, что если Ui(t),. . ., um(t) - оптимальные управления, а x\(t),. . ., xn(t) - опти­мальные траектории, то непременно найдутся такая постоянная ф0 < 0 и такие реше­ния ф\(і)і. . ., фп(і) системы (2.1.9), что функция Я(жі^),. . . , Xn(t), Ui,...,Um, фо, V'i(t),. . ., V'n(t) переменных Ui,...,um, при всех t Є [to, t\] будет достигать макси­мума на U именно при оптимальных управлениях u\(t),. . . ,um(t). Поэтому эту тео­рему, дающую необходимое условие оптимальности в задачах оптимального управле­ния, принято называть принципом максимума. Отметим, что во внутренних точках множества U для оптимального управления выполняются условия (2.1.10), которые являются необходимыми для (2.1.15).

2.1.3 Трудности практического применения принципа максимума

Как же практически воспользоваться условием (2.1.15), ведь функции x\(t),. . ., xn(t), V'i(t),. . ., V'n(t) и постоянная фо, входящие в это условие, неизвестны? Здесь посту­пают следующим образом: рассматривая функцию Я(х, и, ф} фо) как функцию т

Общее решение системы (2.1.20), (2.1.21) зависит от произвольных постоянных, ко­торые определяются из краевых условий (2.1.3), (2.1.4). Задача интегрирования урав­нений (2.1.20), (2.1.21) при краевых условиях (2.1.3), (2.1.4) называется краевой задачей (двухточечной краевой задачей).

Таким образом, принцип максимума позволяет свести решение задачи об оптималь­ном программном управлении к решению краевой задачи.

Трудность ее решения состоит в том, что интегрирование уравнений (2.1.20), (2.1.21) в "прямом времени" не представляется возможным, так как неизвестны начальные условия фі(іо) (і = 1,п). Один из возможных подходов к решению краевой задачи заключается в следующем. Задаваясь произвольным вектором ф(і0) = ф^ и интегри­руя (2.1.20), (2.1.21) при известных начальных условиях x(t0,) ф^ найдем функции x(t), ф(і) и при t = t\ проверим выполнение равенства (2.1.4). Если оно нарушается, задаемся другим вектором ф{іо) = Ф^ и, интегрируя (2.1.20), (2.1.21) при начальных условиях x(t0), ф^ получим при t = t\ вектор x(ti).

Если он не совпадает с заданным, продолжаем процесс до тех пор, пока не найдется такой вектор ф(1;0), что условия (2.1.4) будут выполняться с приемлемой точностью. При этом подходе используются градиентные методы, когда VK^o) определяется из условия минимума "расстояния" x(ti) от заданного вектора х^1).

В вычислительной математике разработан ряд методов приближенного численного решения краевых задач: метод стрельбы, метод прогонки, ряд итерационных мето­дов [2.10], [2.11]. Во многих случаях не представляется возможным найти из условия (2.1.15) явный вид (2.1.18) оптимального управления. Тогда уравнения (2.1.1), сопря­женная система (??) и условия максимума (2.1.15) образуют краевую задачу принципа максимума. Эта задача имеет ряд специфических особенностей, затрудняющих приме­нение стандартных численных методов решения краевых задач. К числу таких особен­ностей относятся разрывы функций и kit) (к = 1,га), удовлетворяющих условию мак­симума (2.1.15), их неединственность, нелинейный характер зависимости (2.1.16) даже в линейных системах. Кроме того, особенностью краевых задач, связанных с принци­пом максимума даже в случаях, когда удается найти явный вид управлений (2.1.16), является их плохая сходимость, вызванная неустойчивостью системы (2.1.20), (2.1.21). Ряд приемов решения краевых задач принципа максимума изложен, например, в [2.12], [2.13]. Отметим в заключение, что, несмотря на различные методы численного реше­ния краевой задачи принципа максимума, процесс решения каждой оптимизации на основе этого принципа является самостоятельной творческой задачей, решаемой в рам­ках той частной отрасли динамики, к которой относится объект управления, с учетом его специфических особенностей, используемых для улучшения сходимости численного решения краевой задачи.


Авторы: 239 А Б В Г Д Е З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Э Ю Я

Книги: 268 А Б В Г Д Е З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Э Ю Я