ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ
«БЕЛГОРОДСКИЙ ГОСУДАРСТВЕННЫЙ НАЦИОНАЛЬНЫЙ
ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ»
( Н И У
« Б е л Г У » )
ИНСТИТУТ ИНЖЕНЕРНЫХ ТЕХНОЛОГИЙ И ЕСТЕСТВЕНННЫХ НАУК
КАФЕДРА ОБЩЕЙ МАТЕМАТИКИ
ПРИМЕНЕНИЕ MIN-ПРОБЛЕМЫ МОМЕНТОВ МАРКОВА К
РЕШЕНИЮ КАНОНИЧЕСКОЙ ЗАДАЧИ БЫСТРОДЕЙСТВИЯ
Выпускная квалификационная работа
обучающегося по направлению подготовки 03.01.01Математика
очной формы обучения, группы 07001309
Топчий Яны Павловны
Научный руководитель
к.ф.-м.н., доцент
Флоринский В.В.
БЕЛГОРОД 2017
СОДЕРЖАНИЕ
ВВЕДЕНИЕ .......................................................................................................... 3
1 ПОСТАНОВКА ЗАДАЧИ БЫСТРОДЕЙСТВИЯ ........................................... 5
1.1. Общая постановка задачи оптимального управления .............................. 5
1.2 Линейная задача быстродействия .............................................................. 8
2 ПРИНЦИП MAX ПОНТРЯГИНА ДЛЯ ЗАДАЧИ БЫСТРОДЕЙСТВИЯ ... 10
2.1 Принцип максимума Понтрягина ............................................................. 10
2.2 Лемма об эквивалентной формулировке принципа максимума
Понтрягина ...................................................................................................... 13
2.3 Схема применения принципа максимума Понтрягина для решения
линейной задачи быстродействия .................................................................. 17
3 РЕШЕНИЕ ЗАДАЧИ БЫСТРОДЕЙСТВИЯ НА ОСНОВЕ
MIN-ПРОБЛЕМЫ МОМЕНТОВ МАРКОВА .................................................. 22
3.1 Min-проблема моментов ........................................................................... 22
3.2 Канонические переменные ....................................................................... 23
3.3 Уравнения для нахождения всех моментов переключения .................... 29
4 ПОСТРОЕНИЕ ЧИСЛЕННОГО РЕШЕНИЯ ................................................. 35
4.1 Общий алгоритм решения ........................................................................ 35
4.2 Численная реализация аналитического метода ....................................... 35
ЗАКЛЮЧЕНИЕ .................................................................................................. 39
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ .......................................... 40
ПРИЛОЖЕНИЕ .................................................................................................. 42
3
ВВЕДЕНИЕ
Проблема
быстродействия,
в
частности
линейная
задача
быстродействия, занимает в современной теории оптимального управления
одно
из
центральных
мест.
Время
быстродействия
есть
наиболее
естественный критерий оптимальности, поэтому задача быстродействия
является одним из наиболее распространенных объектов применения
различных методов оптимального управления. Решение линейных, в
частности, канонических задач важно тем, что к ним можно свести решения
некоторых нелинейных задач [8, 10].
Компьютерное
применение
помогает
связывать
теоретические
исследования с практикой, что является важным элементом в разработке для
решения задач быстродействия численных методов. Чем больше размерность
задач быстродействия, тем больший интерес она представляет. Сложность
решения подобных задач заключается в том, что в ходе выполнения
приходится работать с плохо обусловленными матрицами. В наше время для
решения
задач
быстродействия,
разработка
численных
методов
и
компьютерных программ является актуальной.
Цель работы состоит в изучении методов решения линейных задач
быстродействия и построение численного решения канонической задачи
быстродействия, основанного на min-проблеме моментов А. А. Маркова.
Задачи исследования.
• Изучить методы решения задач быстродействия
• Изучить решение канонической задачи быстродействия, основанной на
min-проблеме моментов А. А. Маркова
• Построить численное решение канонической задачи быстродействия,
основанной на min-проблеме моментов А. А. Маркова.
В работе рассматриваются методы решения задач быстродействия.
Один из методов основан на принципе максимума Понтрягина [3, 4, 15, 17].
4
Другой метод предложенный В.И. Коробовым и Г.М Скляром - на основе
min проблеме моментов Маркова [11].
Структура выпускной квалификационной работы состоит из
введения, четырёх разделов, а также заключения, списка используемой
литературы и приложений.
5
1 ПОСТАНОВКА ЗАДАЧИ БЫСТРОДЕЙСТВИЯ
1.1. Общая постановка задачи оптимального управления
Задачу оптимального управления определяет наличие некоторого
динамического объекта. Пусть положение объекта в каждый момент времени
t полностью характеризуется набором параметров 𝑥 1 (𝑡), … , 𝑥 𝑛 (𝑡).
Вектор
𝑥 (𝑡) = (𝑥 1 (𝑡), … , 𝑥 𝑛 (𝑡))
называют фазовым вектором объекта. Считают, что объект снабжен некими
рулями, от положения которых зависит его поведение. Набор параметров
𝑢1 (𝑡), … , 𝑢𝑚 (𝑡) характеризует положение рулей в каждый момент времени t.
Вектор
𝑢(𝑡) = 𝑢1 (𝑡), … , 𝑢𝑚 (𝑡)
называют управлением или управляющим параметром объекта. В данный
момент времени t состояние объекта не зависит от будущего поведения
управления, а зависит от того, какие значения принимает управление u(t) до
момента времени t.
Разные динамические объекты рассматривают в зависимости от того,
как выражается зависимость вектора фазового состояния x(t) от управления
u(t).
Например,
эта
зависимость
может
описываться
системой
дифференциальных уравнений
𝑥̇ = 𝑓 (𝑡, 𝑥, 𝑢) .
(1.1)
6
Если известно управление u(t) в каждый момент времени t, то траектория
объекта x(t) определяется как решение дифференциального уравнения
𝑥̇ = 𝑓(𝑡, 𝑥, 𝑢(𝑡)).
Предполагается, что динамика объекта задана, т.е. закон изменения
вектора состояния x(t) в зависимости от изменения вектора управления u(t).
Управление u(t) в конкретных физических объектах может не быть
произвольным. Из физического смысла управления вытекают определенные
ограничения.
Например, если 𝑢1 (𝑡) — тяга двигателя, то в каждый момент времени
она должна удовлетворять ограничению
𝑢1𝑚𝑖𝑛 ≤ 𝑢1 (𝑡) ≤ 𝑢1𝑚𝑎𝑥 .
При этом тяга 𝑢1 (𝑡) может принимать также и крайние значения 𝑢1𝑚𝑖𝑛 и
𝑢1𝑚𝑎𝑥 . Предполагается, что в каждый момент времени t вектор управления
u(t) удовлетворяет ограничению
u(t) ∈ 𝑈,
(1.2)
где U — некоторое заданное множество. Часто, в конкретных
физических объектах множество U замкнуто. Эта замкнутость в общем
случае не позволяет исследовать поведение управляемого объекта методами
классического вариационного исчисления. Кроме ограничения вида (1.2)
могут быть наложены ограничения на зависимость управления u(t) от
времени. Например, из физического смысла допустимыми управлениями
могут быть либо кусочно-непрерывные, либо непрерывные, либо гладкие
функции и т.п.
7
Состояния объекта. Допустим, задан начальный момент времени 𝑡0 и
множество допустимых начальных состояний объекта 𝑀0 . Нужно управлять
объектом так, чтобы в какой-то конечный момент времени 𝑡1 объект перешел
на некоторое множество допустимых конечных состояний 𝑀1. Тогда
допустимое управление u(t) переводит объект из множества начальных
состояний 𝑀0 на множество конечных состояний 𝑀1 на отрезке времени
[𝑡0 , 𝑡1]. фазовое состояние объекта x(t) соответствующее этому управлению
u(t) удовлетворяет условиям
𝑥 (𝑡0 ) ∈ 𝑀0 , 𝑥 (𝑡1 ) ∈ 𝑀1
(1.3)
Заметим, что конечный момент времени 𝑡1 может быть, вообще говоря,
не фиксированным, а определяться из условия попадания вектора x(t) на
конечное множество 𝑀1. Итак, предположим, что допустимые множества 𝑀0
и 𝑀1заданы.
Критерий качества. Иногда управляемый объект можно перевести из
множества 𝑀0 на множество 𝑀1 разными способами. Среди всех таких
переходов желательно выбрать в каком-то смысле наилучший. Принято, что
каждому допустимому управлению u(t), заданному на отрезке [𝑡0 , 𝑡1], и
соответствующей ему траектории объекта x(t) сопоставлено некоторое число
J, оценивающее качество пары u(t), x(t), т.е. задан функционал, или
критерий качества J(u(t), x(t)).
Этот функционал может иметь вид
𝑡1
J(u(t), x(t)) = ∫ f 0 (s, x(s), u(s))ds.
𝑡0
(1.4)
8
Задача оптимального управления заключается в нахождении таких
допустимого управления u*(f) и соответствующей ему траектории объекта
x*(t), переводящей объект из множества начальных состояний 𝑀0 на
множество конечных состояний 𝑀1, что при этом функционал качества J(u(f),
x(t)) принимает минимальное значение, т.е.
J(u*(f), x*(t)) = min J(u(f), x(t)).
Здесь минимум берется по всевозможным допустимым управлениям
u(t) и соответствующим траекториям x(t), переводящим объект из
множества начальных состояний 𝑀0 на множество конечных состояний 𝑀1 .
1.2 Линейная задача быстродействия
Простейшая задача оптимального управления — линейная задача
быстродействия. В этой задаче динамика объекта описывается системой
линейных дифференциальных уравнений
𝑥̇ = 𝐴𝑥 + 𝑢,
(1.5)
где 𝑥 — n-мерный вектор фазового состояния объекта, А — постоянная
матрица размером nхn, u — n-мерный вектор управления, на который
наложено ограничение u(t) ∈ 𝑈. Если известна допустимая функция
управления u(t) и начальное состояние объекта 𝑥 (𝑡0 ) = 𝑥0 , то единственная
функция x(t) вектора фазового состояния объекта вычисляется как решение
дифференциального уравнения (1.5).
Начальное и конечное состояния объекта будем выбирать как элементы
некоторых непустых и компактных подмножеств 𝑀0 и 𝑀1 соответственно из
n-мерного фазового пространства. Критерием качества будет служить время
перехода из множества, 𝑀0 на множество 𝑀1, т. е.
9
J(u(t), x(t)) = 𝑡1 − 𝑡0 .
Этот критерий качества получается из (1.4), когда подынтегральная
функция имеет вид
f 0(t, x(t), u(t)) = 1.
Линейная
задача
быстродействия
заключается
в
нахождении
допустимого управления u*(t) и соответствующего ему решения x*(t)
уравнения (1.5), переводящего объект из множества начальных состояний 𝑀0
на множество конечных состояний 𝑀1за минимальное время.
Преимущества линейной задачи быстродействия.
Во-первых, для линейного дифференциального уравнения (1.5) можно
получить зависимость траектории x(t) от управления u(t) в явном виде. Это
позволяет эффективно исследовать все основные вопросы математической
теории оптимального управления.
Во-вторых, на примере линейной задачи быстродействия достаточно
ярко проявляются все характерные трудности, присущие общим задачам
оптимального управления.
10
2 ПРИНЦИП MAX ПОНТРЯГИНА ДЛЯ ЗАДАЧИ БЫСТРОДЕЙСТВИЯ
2.1 Принцип максимума Понтрягина
Принцип максимума Понтрягина является эффективным средством
исследования задач оптимального управления, а также необходимым
условием оптимальности [3, 4, 15, 17].
Пусть задано некоторое допустимое управление u(t) на отрезке
времени 𝐼 = [𝑡0, 𝑡1 ], такое, что соответствующее решение x(t) уравнения
𝑥̇ = 𝐴𝑥 + 𝑢
переводит объект из начального множества 𝑀0 на конечное множество 𝑀1 на
отрезке времени 𝐼 = [𝑡0 , 𝑡1], т.е. удовлетворяет граничным условиям
𝑥 (𝑡0 ) ∈ 𝑀0, 𝑥(𝑡1) ∈ 𝑀1. Пара u(t), x(t) удовлетворяет принципу максимума
Понтрягина на отрезке времени
нетривиальное
решение
𝐼 = [𝑡0 , 𝑡1 ], если существует такое
вспомогательной
системы
дифференциальных
уравнений
𝜓̇ = −𝐴∗𝜓,
(2.1)
что выполнены следующие три условия:
1)
условие максимума
〈𝑢(𝑡), 𝜓(𝑡)〉 = 𝑐(𝑈, 𝜓(𝑡))
(2.2)
для почти всех𝑡 ∈ 𝐼;
2)
условие трансверсальности на множестве 𝑀0
〈𝑥(𝑡0 ), 𝜓(𝑡0)〉 = 𝑐(𝑀0 , 𝜓(𝑡0 ));
(2.3)
11
3)
условие трансверсальности на множестве 𝑀1
〈𝑥(𝑡1), −𝜓(𝑡1)〉 = 𝑐(𝑀1 , −𝜓(𝑡1 )).
(2.4)
Система дифференциальных уравнений (2.1) называется сопряженной,
а ее решение 𝜓(𝑡) − сопряженной функцией. Это решение 𝜓(𝑡) называется
нетривиальным, если 𝜓(𝑡) ≢ 0.
В силу теоремы: Пусть функция u(t) в уравнении 𝑥̇ = 𝐴𝑥 + 𝑢
интегрируема по Лебегу на отрезке 𝐼 = [𝑡0 , 𝑡1 ]. Тогда для любого начального
значения 𝑥 (𝑡0 ) = 𝑥0 абсолютно непрерывное решение x(t) существует,
является единственным и для любого 𝑡 ∈ 𝐼 задается формулой Коши
𝑥 (𝑡) = 𝑒
(𝑡0 −𝑡1 )𝐴
𝑡1
𝑥0 + ∫ 𝑒 (𝑡−𝑠)𝐴 𝑢(𝑠)𝑑𝑠
𝑡0
причем интеграл в этой формуле понимается в смысле Лебега.
Решение 𝜓(𝑡) сопряженной линейной системы уравнений (2.1)
существует на всем отрезке времени 𝐼 = [𝑡0, 𝑡1 ], единственное для любого
начального значения 𝜓(𝑡0 ) и задается формулой Коши
∗
𝜓(𝑡) = 𝑒 (𝑡0 −𝑡)𝐴 𝜓(𝑡0 )
(2.5)
Это решение 𝜓(𝑡) нетривиально, если 𝜓(𝑡) ≢ 0, поскольку матрица
𝐴∗
𝑒 (𝑡0 −𝑡) невырождена. Если начальное значение для сопряженной функции
𝜓(𝑡) задано на правом конце отрезка [𝑡0 , 𝑡1 ], т.е. в точке 𝑡1, то решение 𝜓(𝑡)
системы уравнений (2.1) имеет вид
∗
𝜓(𝑡) = 𝑒 (𝑡1 −𝑡)𝐴 𝜓(𝑡1)
(2.6)
12
Это решение будет нетривиальным, если 𝜓(𝑡1 ) ≢ 0, также в силу
∗
невырожденности экспоненциала 𝑒 (𝑡0 −𝑡)𝐴 .
Пусть
сопряженная
функция
𝜓(𝑡)
задана.
Посмотрим,
какой
геометрический смысл имеют условия (2.2) - (2.4). Условие (2.2) означает,
что вектор 𝜓(𝑡) является опорным вектором к множеству U в точке u(t), для
почти всех моментов времени t на отрезке [𝑡0 , 𝑡1 ], т.е. вектор u(t) выбирается
из множества U таким образом, чтобы скалярное произведение 〈𝑢(𝑡), 𝜓(𝑡)〉
было максимальным (рис. 1). Аналогично, условие трансверсальности на
множестве 𝑀0 (2.3) означает, что вектор 𝜓(𝑡0) является опорным вектором к
множеству 𝑀0 в точке 𝑥(𝑡0 ) (рис. 2), а условие трансверсальности на
множестве 𝑀1 (2.4) означает, что вектор — 𝜓(𝑡1 ) является опорным вектором
к множеству 𝑀1в точке 𝑥 (𝑡1 ) (см. рис. 38). Условие трансверсальности (2.3)
автоматически выполняется с любой сопряженной функцией 𝜓(𝑡), если
множество 𝑀0 состоит из одной точки, т.е. 𝑀0 = {𝑥0 }. Аналогичное
утверждение справедливо и для множества 𝑀1.
Рис. 1
Рис. 2
13
2.2 Лемма об эквивалентной формулировке принципа максимума
Понтрягина
Пусть
допустимое
управление
u(t) ∈ 𝑈, 𝑡 ∈ [𝑡0 , 𝑡1],
таково,
что
соответствующее решение x(t) системы уравнений 𝑥̇ = 𝐴𝑥 + 𝑢 удовлетворяет
граничным условиям 𝑥 (𝑡0 ) ∈ 𝑀0 , 𝑥 (𝑡1 ) ∈ 𝑀1 . Пусть, далее, 𝜓(𝑡) - некоторое
решение сопряженной системы уравнений (2.1). Тогда следующие три
утверждения эквивалентны:
1)
пара
u(t), x(t)
удовлетворяет
принципу
максимума
с
сопряженной функцией 𝜓(𝑡) на отрезке времени 𝐼 = [𝑡0 , 𝑡1];
2)
при всех 𝑡 ∈ 𝐼 вектор 𝜓(𝑡) является опорным вектором к
множеству достижимости X(t) в точке x(t), т.е. выполняется равенство
〈𝑥(𝑡), 𝜓(𝑡)〉 = 𝑐(𝑋 (𝑡), 𝜓(𝑡)).
(2.7)
Кроме того, выполнено условие трансверсальности на множестве 𝑀1(2.4);
3)
при всех 𝑡 ∈ 𝐼 вектор
является опорным вектором к множеству
управляемости Y(t) в точке x(t), т.е. выполняется равенство
〈𝑥(𝑡), −𝜓(𝑡)〉 = 𝑐(𝑌(𝑡), −𝜓(𝑡)).
(2.8)
Так же, выполнено условие трансверсальности на множестве 𝑀0 (2.3).
Доказательство.
Решение
x(t)
уравнения
(1.5)
с
допустимым
управлением 𝑢(𝑡) запишем в виде формулы Коши с начальными условиями в
моменты времени 𝑡0 и 𝑡1:
𝑡
𝑥 (𝑡) = 𝑒
(𝑡−𝑡0 )𝐴
𝑥(𝑡0 ) + ∫ 𝑒 (𝑡−𝑠)𝐴 𝑢(𝑠)𝑑𝑠
𝑡0
(2.9)
14
𝑥 (𝑡) = 𝑒
(𝑡−𝑡1 )𝐴
𝑡1
𝑥(𝑡1 ) + ∫ 𝑒 (𝑡−𝑠)𝐴 𝑢(𝑠)𝑑𝑠
(2.10)
𝑡
Учитывая свойства экспоненциала, из формул (2.5) и (2.9) получаем
выражение
∗
〈𝑥(𝑡), 𝜓(𝑡)〉 = 〈𝑒 (𝑡−𝑡0 )𝐴 𝑥 (𝑡0), 𝑒 (𝑡−𝑡0)𝐴 𝜓(𝑡0 )〉 +
𝑡
∗
+ ∫ 〈𝑒 (𝑡−𝑠)𝐴 𝑢(𝑠), 𝑒 (𝑡−𝑡0 )𝐴 𝜓(𝑡0)〉 𝑑𝑠 = 〈𝑥(𝑡0 ), 𝜓(𝑡0 )〉 +
𝑡0
𝑡
∗
+ ∫ 〈𝑢(𝑠), 𝑒 (𝑡0 −𝑠)𝐴 𝜓(𝑡0 )〉 𝑑𝑠 =
𝑡0
𝑡
= 〈𝑥(𝑡0), 𝜓(𝑡0 )〉 + ∫ 〈𝑢(𝑠), 𝜓(𝑠)〉 𝑑𝑠
(2.11)
𝑡0
Аналогично из формул (2.6) и (2.10) получаем выражение
𝑡1
〈𝑥(𝑡), −𝜓(𝑡)〉 = 〈𝑥(𝑡1 ), 𝜓(𝑡1)〉 + ∫ 〈𝑢(𝑠), 𝜓(𝑠)〉 𝑑𝑠
𝑡
(2.12)
Опорные функции множеств достижимости X(f) и управляемости Y(t):
𝑐(𝑋(𝑡), 𝜓) = 𝑐(𝑀0, 𝑒
(𝑡−𝑡0 )𝐴∗
𝑡
∗
𝜓) + ∫ 𝑐(𝑈, 𝑒 (𝑡−𝑠)𝐴 𝜓)𝑑𝑠
(2.13)
𝑡0
𝑐(𝑌 (𝑡), 𝜓) = 𝑐(𝑀1 , 𝑒
(𝑡−𝑡1 )𝐴∗
𝑡1
∗
𝜓) + ∫ 𝑐(𝑈, −𝑒 (𝑡−𝑠)𝐴 𝜓)𝑑𝑠
(2.14)
𝑡
Подставляя в формулу (2.13) вместо вектора 𝜓 при каждом 𝑡 ∈ 𝐼 вектор
𝜓(𝑡), заданный формулой (2.5), получаем соотношение
15
∗
∗
𝑐(𝑋(𝑡), 𝜓(𝑡)) = 𝑐 (𝑀0 , 𝑒 (𝑡−𝑡0 )𝐴 𝑒 (𝑡0 −𝑡)𝐴 𝜓(𝑡0)) +
𝑡
∗
∗
+ ∫ 𝑐(𝑈, 𝑒 (𝑡−𝑠)𝐴 𝑒 (𝑡0 −𝑡)𝐴 𝜓(𝑡0 ))𝑑𝑠 =
𝑡0
𝑡
∗
= 𝑐(𝑀0, 𝜓(𝑡0 )) + ∫ 𝑐(𝑈, 𝑒 (𝑡0 −𝑠)𝐴 𝜓(𝑡0))𝑑𝑠 =
𝑡0
𝑡
= 𝑐(𝑀0 , 𝜓(𝑡0)) + + ∫ 𝑐(𝑈, 𝜓(𝑠))𝑑𝑠
𝑡0
(2.15)
Аналогично, подставляя в формулу (2.14) вектор − 𝜓(𝑡) заданный
формулой (2.6), получаем соотношение
𝑡1
𝑐(𝑌(𝑡), −𝜓(𝑡)) = 𝑐(𝑀1 , −𝜓(𝑡1 )) + ∫ 𝑐(𝑈, 𝜓(𝑠))𝑑𝑠
𝑡
(2.16)
Докажем теперь эквивалентность утверждений 1 — 3. Пусть пара
u(t),x(t) удовлетворяет принципу максимума на отрезке времени [𝑡0 , 𝑡1]. Из
условия максимума (2.2) и условия трансверсальности на множестве 𝑀0 (2.3)
следует, что правые части выражений (2.11) и (2.15) совпадают. Таким
образом, выполняется равенство (2.7). Аналогично из формул (2.2) и (2.4)
следует, что правые части выражений (2.12) и (2.16) совпадают. Таким
образом, выполняется равенство (2.8). Следовательно, из утверждения 1
получаем 2 и 3.
Пусть выполнено утверждение 2. Из равенства (2.7) при 𝑡0 = 𝑡1
получаем соотношение
𝑐(𝑋(𝑡1), 𝜓(𝑡1)) − 〈𝑥(𝑡1 ), 𝜓(𝑡1 )〉 = 0
Используя формулы (2.15) и (2.11), преобразуем его к виду
16
𝑡1
[𝑐(𝑀0, 𝜓(𝑡0 )) − 〈𝑥(𝑡0), 𝜓(𝑡0 )〉] + ∫ [𝑐(𝑈, 𝜓(𝑠)) − 〈𝑢(𝑠), 𝜓(𝑠)〉] 𝑑𝑠 = 0
𝑡0
(2.17)
Из включений 𝑥 (𝑡0) ∈ 𝑀0 и 𝑢(𝑡) ∈ 𝑈 при всех 𝑡 ∈ 𝐼 согласно свойствам
опорных функций следует, что первое слагаемое в формуле (2.17)
неотрицательно, подынтегральная функция также неотрицательна, значит, и
интеграл неотрицателен. Таким образом, из равенства (2.17) получаем
следующие равенства:
𝑐(𝑀0 , 𝜓(𝑡0 )) − 〈𝑥(𝑡0 ), 𝜓(𝑡0)〉 = 0
𝑡1
∫ [𝑐(𝑈, 𝜓(𝑠)) − 〈𝑢(𝑠), 𝜓(𝑠)〉] 𝑑𝑠 = 0
𝑡0
Из
множестве
первого равенства
𝑀0
подынтегральной
(2.3),
а
функции
вытекает
условие
трансверсальности на
из
второго,
с
и
свойства
интеграла
максимума (2.2) при почти всех
учетом
неотрицательности
Лебега—
условие
𝑡 ∈ [𝑡0 , 𝑡1 ]; Следовательно, из
утверждения 2 получается утверждение 1.
Аналогично из утверждения 3 следует утверждение 1. Действительно,
из равенства (2.8) при 𝑡 = 𝑡0 получаем соотношение
𝑐 (𝑌(𝑡0), −𝜓(𝑡0 )) − 〈𝑥(𝑡0 ), −𝜓(𝑡0 )〉 = 0
Используя формулы (2.16) и (2.12), преобразуем его к виду
[𝑐(𝑀1, −𝜓(𝑡1)) − 〈𝑥(𝑡1), −𝜓(𝑡1)〉] + [𝑐(𝑈, 𝜓(𝑠)) − 〈𝑢(𝑠), 𝜓(𝑠)〉] = 0
(2.18)
17
Из включений 𝑥 (𝑡1) ∈ 𝑀1 и 𝑢(𝑡) ∈ 𝑈 получаем, что оба слагаемые в
формуле (2.18) неотрицательны, следовательно, равны нулю.
[𝑐(𝑀1 , −𝜓(𝑡1 )) − 〈𝑥(𝑡1 ), −𝜓(𝑡1 )〉] − дает условие трансверсальности на
множестве 𝑀1 (2.4).
[𝑐(𝑈, 𝜓(𝑠)) − 〈𝑢(𝑠), 𝜓(𝑠)〉] − условие максимума (2.2) при почти всех
𝑡 ∈ 𝐼.
Таким образом, лемма полностью доказана.
2.3 Схема применения принципа максимума Понтрягина для решения
линейной задачи быстродействия
Линейная
задача
быстродействия
заключается
в
нахождении
допустимого управления u(t) ∈ 𝑈, переводящего объект, описываемый
уравнением
𝑥̇ = 𝐴𝑥 + 𝑢,
(2.19)
из начального множества 𝑀0 на конечное множество 𝑀1за наименьшее
время. Допустимым управлением является произвольная измеримая функция
u(t) ∈ 𝑈,
множества
𝑀0, 𝑀1 , 𝑈 ∈ 𝐸 𝑛
предполагаются
непустыми
и
компактными.
Теорема о необходимых условиях оптимальности. Пусть в задаче
быстродействия множества 𝑀0 и 𝑀1 выпуклы. Пусть, далее, u(t) оптимальное управление, переводящее объект из множества
𝑀0 на
множество 𝑀1 на отрезке времени 𝐼 = [𝑡0 , 𝑡1] и x(t) — соответствующее
решение уравнения (2.19). Тогда пара u(t), x(t) удовлетворяет принципу
максимума Понтрягина на отрезке времени I.
18
Согласно этой теореме, по определению пара u(t), x(t) удовлетворяет
принципу
максимума
на
отрезке
[𝑡0 , 𝑡1],
если
существует
такое
нетривиальное решение вспомогательной сопряженной системы
𝜓̇ = −𝐴∗𝜓,
(2.20)
что выполнены следующие три условия:
1)
условие максимума
〈𝑢(𝑡), 𝜓(𝑡)〉 = 𝑐(𝑈, 𝜓(𝑡))
(2.21)
для почти всех 𝑡 ∈ 𝐼;
2)
условие трансверсальности на множестве 𝑀0
〈𝑥(𝑡0 ), 𝜓(𝑡0)〉 = 𝑐(𝑀0 , 𝜓(𝑡0 ));
3)
(2.22)
условие трансверсальности на множестве 𝑀1
〈𝑥(𝑡1 ), −𝜓(𝑡1)〉 = 𝑐(𝑀1 , −𝜓(𝑡1 )).
(2.23)
Таким образом, для решения задачи быстродействия можно поступить
следующим образом. Найти все управления, удовлетворяющие принципу
максимума Понтрягина, а затем среди этого множества управлений какимлибо образом найти действительно оптимальное управление. Эффективность
такого подхода определяется тем, как много управлений будет удовлетворять
принципу максимума. Чем уже множество таких уравнений, тем проще
выбрать из него действительно оптимальное управление. Оказывается, что
принцип максимума Понтрягина в этом смысле является довольно
эффективным средством решения линейных задач быстродействия.
19
Заметим, что если сопряженная функция является решением линейной
системы уравнений (2.20) и удовлетворяет равенствам (2.21)—(2.23), то
функция 𝜆𝜓, где 𝜆 — произвольное неотрицательное число, также является
решением системы (2.20) и удовлетворяет равенствам (2.21)—(2.23). Это
следует из того факта, что система уравнений (2.2) линейна и однородна, а
опорные функции в равенствах (2.21)—(2.23) положительно однородны. По
свойству
1
опорных
функций:
Опорная
функция
𝑐(𝐹, ∙): 𝐸 𝑛 → 𝐸1
положительно однородна, т.е.
𝑐 (𝐹, 𝜆𝜓 ) = 𝜆𝑐(𝐹, 𝜓)
для любого вектора𝜓 ∈ 𝐸 𝑛 и любого числа 𝜆 ≥ 0.
В частности, 𝑐 (𝐹, 0) = 0.
Таким
образом,
при
отыскании
сопряженных
функций
𝜓(𝑡),
удовлетворяющих принципу максимума Понтрягина, можно нормировать эти
функции в какой-нибудь момент времени, например при 𝑡 = 𝑡0 , ‖𝜓(𝑡0 )‖ = 1,
и перебирать сопряженные функции𝜓(𝑡) с начальными условиями из
единичной сферы, 𝜓(𝑡0 ) ∈ 𝑆.
Рассмотрим,
как
построить
все
управления,
удовлетворяющие
принципу максимума. Для этого можно предложить следующую схему:
Рис.3
Начальный момент времени 𝑡0 в нашей задаче зафиксирован. Возьмем
произвольный начальный вектор 𝜓(𝑡0 ) из единичной сферы 𝑆 ⊂ 𝐸 𝑛 . Найдем
20
решение 𝜓(𝑡) сопряженной системы (2.20) с этим начальным значением
𝜓(𝑡0 ). В силу теоремы: Пусть функция u(t) в уравнении (2.19) интегрируема
по Лебегу на отрезке 𝐼 = [𝑡0 , 𝑡1 ]. Тогда для любого начального значения
𝑥 (𝑡0 ) = 𝑥0
абсолютно
непрерывное
решение
x(t)
уравнения
(2.19)
существует, является единственным и для любого 𝑡 ∈ 𝐼 задается формулой
Коши
𝑡
𝑥 (𝑡) = 𝑒 (𝑡0 −𝑡1)𝐴 𝑥0 + ∫𝑡 1 𝑒 (𝑡−𝑠)𝐴 𝑢(𝑠)𝑑𝑠,
0
Это решение 𝜓(𝑡) существует и единственно на любом отрезке
времени
[𝑡0 , 𝑡1 ], 𝑡1 ≥ 𝑡0.
Единственность
этого
решения
на
схеме
обозначается одинарной стрелкой. Затем, зная решение 𝜓(𝑡) сопряженной
системы, найдем все допустимые управления u(t) ∈ 𝑈, удовлетворяющие
условию максимума (2.21). Таких управлений u(t) может быть несколько, на
схеме обозначаются двойной стрелкой. По данному начальному вектору
𝜓(𝑡0 ) найдем все начальные значения вектора фазового состояния объекта
𝑥 (𝑡0 )
из
начального
множества
𝑀0 ,
удовлетворяющие
условию
трансверсальности на множестве 𝑀0 (2.22). Этих начальных значений 𝑥 (𝑡0 )
может быть несколько. Это также показано на схеме двойной стрелкой. Зная
допустимое управление u(t) и начальное состояние объекта 𝑥 (𝑡0 ), можно
найти решение уравнения (2.19). В силу теоремы решение x(t) находится
однозначно начальному условию 𝑥 (𝑡0 ) и по функции u(t). Когда решение x(t)
построено, нужно проверить, достигнет ли это решение при каком-либо 𝑡1 ≥
𝑡0 множества 𝑀1 или нет. Если решение x(t) достигнет в какой-то момент 𝑡1
множества 𝑀1, то выполняется ли условие трансверсальности на множестве
𝑀1 (2.23). Если это условие выполнено, то пара u(t), x(t) удовлетворяет
принципу максимума Понтрягина на полученном отрезке времени [𝑡0 , 𝑡1 ]; в
противном случае пара u(t), x(t) не удовлетворяет принципу максимума.
21
При таком подходе все пары u(t), x(t), удовлетворяющие принципу
максимума, зависят лишь от начального вектора 𝜓(𝑡0) ∈ 𝑆, причем эта
зависимость на двух этапах может быть неоднозначной. Отметим, что если
объект является управляемым из множества 𝑀0 на множество 𝑀1 на отрезке
времени [𝑡0 , 𝑡1 ], то решения 𝜓(𝑡) и x(t) в данной схеме можно строить лишь
на этом отрезке времени.
22
3
РЕШЕНИЕ
ЗАДАЧИ
БЫСТРОДЕЙСТВИЯ
MIN-ПРОБЛЕМЫ МОМЕНТОВ МАРКОВА
НА
ОСНОВЕ
3.1 Min-проблема моментов
Классическую
(-L,L)
проблему
моментов
Маркова
можно
сформулировать следующим образом.
Дана последовательность непрерывных на [a,b] функций {𝑔𝑘 (𝑡)}𝑛𝑘=1.
Требуется:
1) Найти условия, которым должен удовлетворять вещественный
вектор S={𝑆1 , 𝑆2 , … , 𝑆𝑛 }, если известно, что существует хотя бы одна
измеримая функция f(t), 𝑡𝜖[a, b]. Такая, что
𝑏
𝑆𝑘 = ∫𝑎 𝑔𝑘 (𝑡) f(t)dt, k=1,…, n; |𝑓(𝑡)| ≤ 𝐿, 𝑡𝜖[a, b].
2) Исследовать некоторые простейшие функции f(t) для заданного
вектора S.
Min-проблема моментов заключается в том, что для любых заданных
моментов S указать минимальный возможный отрезок [𝑎, 𝑎 + 𝑄𝑠 ] и функцию
𝑓𝑠 (𝑡) такие что
𝑏
𝑆𝑘 = ∫𝑎 𝑔𝑘 (𝑡) f(t)dt, k=1,…,n; |𝑓(𝑡)| ≤ 𝐿, 𝑡𝜖 [𝑎, 𝑎 + 𝑄𝑠 ].
Если 𝑔𝑘 (𝑡) = 𝑡 𝑘−1, то степенная проблема моментов.
Если 𝑔𝑘 (𝑡) = 𝑒 𝑖(𝑘−1)𝑡 , то тригонометрическая проблема моментов.
Критерий управляемости для 𝒙̇ = 𝑨𝒙 + 𝒃𝒖.
Рассмотрим задачу 𝑥̇ = 𝐴𝑥 + 𝑏𝑢,|𝑢| ≤ 1, 𝑥 (0) = 𝑥0 , 𝑥(Θ) = 0, Θ → 𝑚𝑖𝑛.
А- матрица n×n, b-вектор-столбец.
Система управляема тогда и только тогда, когда rank(b, Ab, … 𝐴𝑛−1𝑏) =
𝑛.
23
𝑡
Решение.𝑥 (𝑡) = 𝑒 𝐴𝑡 (𝑥0 + ∫0 𝑒 −𝐴𝜏 𝑏𝑢 (𝜏))𝑑𝜏,
учитывая, что𝑥 (0) = 𝑥0 , 𝑥 (Θ) = 0, Θ → 𝑚𝑖𝑛,можно записать:
Θ
𝑥 = ∫ 𝑒 −𝐴𝜏 𝑏𝑢(𝜏)𝑑𝜏
0
𝑥 – заданная начальная точка.
Для оптимальности по быстродействию функция 𝑢 (𝑡) кусочно
постоянная, принимающая значения ≠ 1. Кроме того, если матрица A имеет
вещественный спектр,
то число
точек разрыва не
превышает
n-1
(т. Фельдбаума).
Обозначим 𝑇1, 𝑇2 , … , 𝑇𝑛−1, 𝑇𝑛 = Θ – точка разрыва функции 𝑢 (𝑡), которые
называются моментами переключения; 𝑢̃ = ∓1 – управление на [𝑇𝑛−1, Θ].
Решение задачи быстродействия сводится к нахождению времени
быстродействия 𝑇𝑛 = Θ, рода управления 𝑢̃
и моментов переключения
𝑇1 , 𝑇2, … , 𝑇𝑛−1.
Таким образом, если 𝑆𝑘 = −𝑥𝑘 , g(t)=𝑒 −𝐴𝜏 𝑏, то задача сводится
Θ
𝑆𝑘 = ∫0 𝑔𝑘 (𝑡) 𝑢(t)dt – проблема моментов, 𝑘 = 1, 2, … , 𝑛.
3.2 Канонические переменные
Для решения задачи:
𝑥1̇ = 𝑢, |𝑢| ≤ 1.
𝑥𝑖̇ = 𝑥𝑖−1,
𝑥(0) = 𝑥,
В
[5]
вводятся
(3)
𝑖 = 2, … , 𝑛,
𝑥 (Θ) = 0, Θ → 𝑚𝑖𝑛.
две
последовательности
𝛼𝑘 (𝑥, Θ)и 𝛽𝑘 (𝑥, Θ)следующими уравнениями:
полиномов
24
𝛼1
Θ − 𝑥1 −1
𝛼1 =
,|
⋮
2
0
2𝛼2
𝛼1
⋮
0
…
…
⋱
…
(𝑘 − 1)𝛼𝑘−1
𝛼𝑘−2
⋮
−1
𝑘𝛼𝑘
𝛼𝑘−1
|
⋮
𝛼1
(3.1)
𝑘𝛽𝑘
𝛽𝑘−1
|
⋮
𝛽1
(3.2)
Θ𝑘 + (−1)𝑘 𝑘! 𝑥𝑘
=
,
2
𝑘 = 2, … , 𝑛;
𝛽1 2𝛽2
Θ + 𝑥1 −1 𝛽1
𝛽1 =
,|
⋮
⋮
2
0
0
…
…
⋱
…
(𝑘 − 1)𝛽𝑘−1
𝛽𝑘−2
⋮
−1
Θ𝑘 − (−1)𝑘 𝑘! 𝑥𝑘
=
,
2
𝑘 = 2, … , 𝑛.
Обозначим через 𝑢̃ управление на последнем интервале [𝑇𝑛−1, Θ].
Если𝑢̃ = −1, то 𝑢̃ будем называть управлением первого рода, если 𝑢̃ = +1,
то это управление второго рода. В работах [12,13] вводится в рассмотрение
последовательность полиномов 𝛾𝑘 (𝑥, Θ, 𝑢̃) следующим образом:
𝛾𝑘 (𝑥, Θ, 𝑢̃) = {
𝛼𝑘 (𝑥, Θ), если 𝑢̃ = −1
𝛽𝑘 (𝑥, Θ), если 𝑢̃ = +1
(3.3)
Тогда, используя равенства (3.1) и (3.2). последовательность 𝛾𝑘 (𝑥, Θ, 𝑢
⃗)
можно получить из аналогичных уравнений:
𝛾1
Θ + 𝑢̃𝑥1 −1
𝛾1 =
,|
⋮
2
0
2𝛾2
𝛾1
⋮
0
…
…
⋱
…
(𝑘 − 1)𝛾𝑘−1
𝛾𝑘−2
⋮
−1
Θ𝑘 − (−1)𝑘 𝑢̃𝑘! 𝑥𝑘
=
,
2
𝑘𝛾𝑘
𝛾𝑘−1
|=
⋮
𝛾1
𝑘 = 2, … , 𝑛.
(3.4)
25
Обозначим правые части равенств (3.4), (3.1) и (3.2) через 𝐺𝑘 , 𝐴𝑘 , 𝐵𝑘 , т.е
Θ𝑘 + (−1)𝑘+1𝑢̃𝑘! 𝑥𝑘
𝐺𝑘 =
,
2
𝑘 = 1, … , 𝑛;
Θ𝑘 + (−1)𝑘 𝑘! 𝑥𝑘
𝐴𝑘 =
,
2
𝑘 = 1, … , 𝑛;
Θ𝑘 + (−1)𝑘+1𝑘! 𝑥𝑘
𝐵𝑘 =
,
2
𝑘 = 1, … , 𝑛;
(3.5)
(3.5а)
(3.5б)
Очевидно, что
𝐺𝑘 = {
𝐴𝑘 , если 𝑢̃ = −1
𝐵𝑘 , если 𝑢̃ = +1
(3.6)
Раскрывая определитель в равенстве (3.4) по последнему столбцу,
получим
𝑘−1
𝐺𝑘 = ∑ 𝛾𝑖 𝐺𝑘−𝑖 + 𝑘𝛾𝑘 ,
𝑘 = 1, … , 𝑛;
𝑖=1
(3.7)
Отсюда следует рекуррентная формула для 𝛾𝑘 :
𝑘−1
Θ + 𝑢̃𝑥1
1
𝛾1 =
, 𝛾𝑘 = (𝐺𝑘 − ∑ 𝛾𝑖 𝐺𝑘−𝑖 ) ,
2
𝑘
𝑘 = 2, … , 𝑛;
𝑖=1
Аналогичным
образом
𝛼𝑘 (𝑥, Θ), 𝛽𝑘 (𝑥, Θ), 𝛾𝑘 (𝑥, Θ, 𝑢̃):
введем
последовательности
(3.8)
полиномов
26
𝛼1
Θ − 𝑥1 −1
𝛼1 = −
̅̅̅
,|
⋮
2
0
2𝛼2
𝛼1
⋮
0
…
…
⋱
…
(𝑘 − 1)𝛼𝑘−1
𝛼𝑘−2
⋮
−1
Θ𝑘 + (−1)𝑘 𝑘! 𝑥𝑘
=−
,
2
𝛽1 2𝛽2
Θ + 𝑥1 −1 𝛽1
̅̅̅
𝛽1 = −
,|
⋮
⋮
2
0
0
…
…
⋱
…
𝛾1 2𝛾2
Θ + 𝑢̃𝑥1 −1 𝛾1
𝛾̅1 = −
,|
⋮
⋮
2
0
0
…
…
⋱
…
𝑘𝛽𝑘
𝛽𝑘−1
|=
⋮
𝛽1
(3.10)
𝑘 = 2, … , 𝑛;
(𝑘 − 1)𝛾𝑘−1
𝛾𝑘−2
⋮
−1
Θ𝑘 − (−1)𝑘 𝑢̃𝑘! 𝑥𝑘
=−
,
2
(3.9)
𝑘 = 2, … , 𝑛;
(𝑘 − 1)𝛽𝑘−1
𝛽𝑘−2
⋮
−1
Θ𝑘 − (−1)𝑘 𝑘! 𝑥𝑘
=−
,
2
𝑘𝛼𝑘
𝛼𝑘−1
|=
⋮
𝛼1
𝑘𝛾𝑘
𝛾𝑘−1
|=
⋮
𝛾1
(3.11)
𝑘 = 2, … , 𝑛;
Откуда видно, что
𝛼 (𝑥, Θ), если𝑢̃ = −1
̅̅̅
𝛾
̅̅̅
̃ ) = { ̅̅̅𝑘
𝑘 (𝑥, Θ, 𝑢
𝛽𝑘 (𝑥, Θ), если𝑢̃ = +1
(3.12)
Обозначим правые части равенств (3.9), (3.10) и (3.11) через 𝐺𝑘 , 𝐴𝑘 , 𝐵𝑘
соответственно, т.е
̅̅̅
𝐺𝑘 = −
Θ𝑘 − (−1)𝑘+1 𝑢̃𝑘! 𝑥𝑘
,
2
𝑘 = 1, … , 𝑛;
(3.13)
27
Θ𝑘 − (−1)𝑘 𝑘! 𝑥𝑘
̅̅
𝐴̅̅𝑘 = −
,
2
̅𝐵̅̅𝑘̅ = −
𝑘 = 1, … , 𝑛;
Θ𝑘 + (−1)𝑘+1𝑘! 𝑥𝑘
,
2
𝑘 = 1, … , 𝑛;
(3.13а)
(3.13б)
Очевидно, что
̅̅
𝐴̅̅, если 𝑢̃ = −1
̅̅̅
𝐺𝑘 = { 𝑘
̅𝐵̅̅𝑘̅, если 𝑢̃ = +1
(3.14)
Раскрывая определитель в равенстве (3.11) по последнему столбцу,
получим равенство, аналогичное (3.7):
𝑘−1
̅̅̅
̅̅̅̅̅̅
𝐺𝑘 = ∑ 𝛾̅𝐺
̅̅̅,
𝑖 𝑘−𝑖 + 𝑘𝛾
𝑘
𝑘 = 1, … , 𝑛;
(3.15)
𝑖=1
Отсюда следует рекуррентная формула, аналогичная (3.8):
𝑘−1
Θ + 𝑢̃𝑥1
1
̅̅̅̅̅̅
𝛾̅1 = −
,𝛾
̅̅̅
𝑘 = (𝐺𝑘 − ∑ 𝛾̅𝑖 𝐺𝑘−𝑖 ) ,
2
𝑘
𝑘 = 2, … , 𝑛;
𝑖=1
(3.16)
Замечание. Канонические переменные 𝛾𝑘 можно вычислять, используя
явную формулу
𝐺1
(−1)𝑘−1 | 𝐺2
𝛾𝑘 =
,| ⋮
𝑘!
𝐺𝑘−1
𝐺𝑘
1
𝐺1
⋮
𝐺𝑘−2
𝐺𝑘−1
0
2
⋮
𝐺𝑘−3
𝐺𝑘−2
…
…
⋱
…
…
0
0
⋮ |,
|
𝑘−1
𝐺1
𝑘 = 1, … , 𝑛;
(3.17)
28
̅̅̅
если в данной формуле заменить 𝛾𝑘 и 𝐺𝑘 на 𝛾
̅̅̅
𝑘 и 𝐺𝑘 . соответственно, то
получим аналогичную формулу для вычисления переменных ̅̅̅.
𝛾𝑘
Из равенств (3.5) и (3.13) видно, что
̅̅̅
𝐺𝑘 = −𝐺𝑘 ,
̅̅
𝐴̅̅𝑘 = −𝐴𝑘 ,
̅𝐵̅̅𝑘̅ = −𝐵𝑘 .
Дополним систему (3) уравнением Θ = −1 и рассмотрим систему
𝑥1̇ = 𝑢,
𝑥𝑖̇ = 𝑥𝑖−1,
Θ̇ = −1.
(3.18)
Тогда имеет место следующее утверждение.
Утверждение 1.1. Полиномы 𝛾𝑘 (𝑥, Θ, 𝑢̃) удовлетворяют системе
дифференциальных уравнений
̅̅̅𝑘̇ = −(𝑘 − 1)̅̅̅̅̅̅,
𝛾
𝛾𝑘−1
𝑘 = 1, … , 𝑛,
(3.19)
и системе
𝛾
̅̅̅
𝛾𝑘̇ = −𝑘𝛾
̅̅̅̅̅̅,
𝑘̇ = 1, ̅̅̅
𝑘−1
𝑘 = 2, … , 𝑛,
(3.20)
где производные 𝛾
̅̅̅
𝑘̇ в (3.19) и (3.20) берутся в силу системы (3.18) с
управлением 𝑢 = 𝑢̃ и 𝑢 = −𝑢̃ соответственно.
29
3.3 Уравнения для нахождения всех моментов переключения
В [11] описан аналитический метод нахождения времени
быстродействия Θ и рода управления 𝑢̃ для канонической задачи
быстродействия.
Используется последовательность определителей Маркова:
∆1= 𝛾1 ,
𝛾1
𝛾2
∆2𝑝−1= | ⋮
𝛾𝑝
∆2 = 𝛾2 ,
𝛾2
𝛾3
⋮
𝛾𝑝+1
…
…
⋱
…
𝛾1
∆3= |𝛾
2
𝛾𝑝
𝛾𝑝+1
⋮ |,
𝛾2𝑝−1
𝛾2
𝛾3 | ,
𝛾2
∆4 = |𝛾
𝛾1
𝛾3
∆2𝑝 = | ⋮
𝛾𝑝+1
3
𝛾3
𝛾4
⋮
𝛾𝑝+2
𝛾3
𝛾4 | , …,
…
…
⋱
…
𝛾𝑝+1
𝛾𝑝+2
⋮ |
𝛾2𝑝
Время быстродействия Θ0 является наибольшим вещественным корнем
уравнения
∆𝑛 (𝛾1 (𝑥, Θ, −1), … , 𝛾𝑛 (𝑥, Θ, −1) ∙ ∆𝑛 (𝛾1(𝑥, Θ, +1), … , 𝛾𝑛 (𝑥, Θ, +1)) = 0
При этом если наибольший вещественный корень Θ0 получается из
уравнения
∆𝑛 (𝛾1 (𝑥, Θ, −1), … , 𝛾𝑛 (𝑥, Θ, −1)) = 0,
то 𝑢̃ = −1 (управление 1-го рода);
если наибольший вещественный корень Θ0 получается из уравнения
∆𝑛 (𝛾1 (𝑥, Θ, +1), … , 𝛾𝑛 (𝑥, Θ, +1)) = 0
то 𝑢̃ = +1 (управление 2-го рода).
30
Теорема. Пусть для системы (3) время оптимального быстродействия
Θ. Тогда моменты переключения 𝑇𝑖 , 𝑖 = 1, … , 𝑛 − 1, оптимального управления
𝑢(𝑡) определяются как корни следующих уравнений:
1) для 𝑛 = 2𝑝
𝛾2
⋮
|𝛾
𝑝
1
𝛾3
⋮
𝛾𝑝+1
𝑧
…
⋱
…
…
𝛾𝑝+1
⋮
𝛾2𝑝−1| = 0
𝑧 𝑝−1
(3.21)
для нахождения четных моментов переключения𝑇2, 𝑇4 , 𝑇2𝑝−2, и
1
−𝛾̅1
|
| ⋮
−𝛾̅𝑝−1
−1
𝛾̅1
𝛾̅2
⋮
𝛾̅𝑝
𝑧
…
…
⋱
…
…
𝛾̅𝑝
𝛾̅𝑝+1
|
⋮ |=0
𝛾̅2𝑝−1
𝑧𝑝
(3.22)
для нахождения нечетных моментов переключения𝑇1, 𝑇3, 𝑇2𝑝−1;
2) для 𝑛 = 2𝑝 − 1
𝛾̅1
⋮
|
𝛾̅𝑝−1
1
𝛾̅2
⋮
𝛾̅𝑝
𝑧
…
⋱
…
…
𝛾̅𝑝
⋮
𝛾̅2𝑝−2
𝑧 𝑝−1
|=0
(3.23)
для нахождения четных моментов переключения𝑇2, 𝑇4 , 𝑇2𝑝−2, и
𝛾1
⋮
|𝛾
𝑝−1
1
𝛾2
⋮
𝛾𝑝
𝑧
…
⋱
…
…
𝛾𝑝
⋮
𝛾2𝑝−2| = 0
𝑧 𝑝−1
для нахождения нечетных моментов переключения𝑇1, 𝑇3, 𝑇2𝑝−3.
(3.24)
31
Замечание. Уравнение для нахождения всех моментов переключения (четных
и нечетных 𝑇1, 𝑇2, … , 𝑇𝑛−1) в случае 𝑛 = 2𝑝 можно записать в следующем
виде:
𝛾2
⋮
|𝛾
𝑝
1
𝛾3
⋮
𝛾𝑝+1
𝑧
…
⋱
…
…
1
𝛾𝑝+1
−𝛾1
⋮
|
𝛾2𝑝−1| | ⋮
−𝛾𝑝−1
𝑧 𝑝−1
−1
𝛾1
𝛾2
⋮
𝛾𝑝
𝑧
…
…
⋱
…
…
𝛾𝑝
𝛾𝑝+1
|
= 0,
⋮
|
𝛾2𝑝−1
𝑧𝑝
(3.25)
а уравнение для нахождения всех моментов переключения для случая
𝛾1
⋮
|𝛾
𝑝−1
1
𝛾2
⋮
𝛾𝑝
𝑧
…
⋱
…
…
𝛾𝑝
⋮
𝛾1
⋮
|
|
𝛾2𝑝−2 𝛾𝑝−1
𝑧 𝑝−1
1
𝛾2
⋮
𝛾𝑝
𝑧
…
⋱
…
…
𝛾𝑝
⋮
𝛾2𝑝−2
𝑧 𝑝−1
|=0
(3.26)
Поскольку для заданной начальной точки 𝑥 = 𝑥 (0) время
быстродействия Θ определено, то в левых частях равенств (3.25) и (3.26)
𝛾1 … . . 𝛾2𝑝−1- известные числа, тогда левые части этих равенств представляют
собой полиномы степени n - 1 относительно z, корнями которых являются
все моменты переключения и только они.
Рассмотрим еще одну
переменных 𝜓0 , 𝜓1, … , 𝜓𝑛−1:
систему
относительно
вспомогательных
𝜓̇ = −𝐴∗𝜓,
где 𝐴∗ матрица, транспонированная к матрице А. Решение этой системы
вектор 𝜓с компонентами (𝜓0 , 𝜓1, … , 𝜓𝑛−1), который является опорным
вектором к области управляемости системы
𝑥̇ = 𝐴𝑥 + 𝑏𝑢, |𝑢| ≤ 1, 𝑥(0) = 𝑥0 , 𝑥 (Θ) = 0, Θ → 𝑚𝑖𝑛 ,
(b, Ab, … 𝐴𝑛−1𝑏) = 𝑛
в начальной точке 𝑥 (0). Оптимальное управление
(*)
32
𝑢 (𝑡) = 𝑠𝑖𝑔𝑛(𝜓, −𝑒 −𝐴𝑡 𝑏) = −𝑠𝑖𝑔𝑛(𝜓, 𝑒 −𝐴𝑡 𝑏)
(3.27)
Скалярное произведение (𝜓, exp(−𝐴𝑡) 𝑏) представляет собой полином
𝑛−1
(𝜓, −𝑒 −𝐴𝑡 𝑏) = ∑
(−1)𝑘 𝜓𝑘 𝑡 𝑘
𝑘=0
(3.28)
𝑘!
Корни этого полинома согласно равенству (3.27) являются моментами
переключения. Следовательно, полином (3.28) с точностью до постоянного
множителя совпадает с левой частью уравнения (3.25) при 𝑛 = 2𝑝и с левой
частью уравнения (3.26) при 𝑛 = 2𝑝 − 1. Если записать левую часть
вышеуказанных уравнений в виде
𝑐0 + 𝑐1𝑡 + 𝑐2𝑡 2 + ⋯ + 𝑐𝑛−1𝑡 𝑛−1 ,
то
𝜓𝑘 = (−1)𝑘 𝑘! 𝑐𝑘 ,
𝑘 = 0, … , 𝑛 − 1.
То есть вектор 𝑔 с компонентами
(𝑐0, −𝑐1, 2! 𝑐2, … , (−1)𝑛−1(𝑛 − 1)! 𝑐𝑛−1
(3.29)
является опорным вектором к области управляемости системы(*).
Пример.
Рассмотрим теперь задачу быстродействия для системы (3) при n = 6 из
начальной точки 𝑥 = (0,0,0,0,0, 𝑥6 ) в начало координат.В этом случае р = 3,
Θ
Θ2
Θ3
5Θ4
𝛾1 (𝑥, Θ) = ; 𝛾2 (𝑥, Θ) =
; 𝛾3 (𝑥, Θ) =
; 𝛾 (𝑥, Θ) =
;
2
8
16 4
128
7Θ5
21Θ6
𝛾5 (𝑥, Θ) =
; 𝛾 (𝑥, Θ) = 10 − 60𝑢̃𝑥6 ;
256 6
2
33
Θ
3Θ2
5Θ3
𝛾̅1 (𝑥, Θ) = − ; ̅̅̅
𝛾2 (𝑥, Θ) = −
; ̅̅̅
𝛾3 (𝑥, Θ) = −
;
2
8
16
𝛾̅4 (𝑥, Θ) = −
35Θ4
63Θ5
(
)
; 𝛾5 𝑥, Θ = −
;
128
256
Находим время оптимального быстродействия
Θ = Θ(𝑥 ) = 4 6√30𝑥6
и род управления, которое является управлением второго рода, т.е. 𝑢̃ = +1.
Из (3.21а) находим, что уравнение для нахождения четных моментов
переключения имеет вид
𝛾2
|𝛾3
1
𝛾3
𝛾4
𝑡
𝛾4
𝛾5 | = 0
𝑡2
или 16𝑡 2 − 16Θt + 3Θ2 = 0, корни этого уравнения.
Из (3.22а) находим, что уравнение для нахождения всех нечетных
моментов переключения имеет вид
1
−𝛾
| 1
−𝛾2
−1
𝛾1
𝛾2
𝛾3
𝑡
𝛾2
𝛾3
𝛾4
𝑡2
𝛾3
𝛾4
|=0
𝛾5
𝑡3
34
или 32𝑡 3 − 48Θ𝑡 2 + 18Θ2 t − Θ3 = 0, корни этого уравнения
𝑇1 =
2 − √3
Θ,
4
𝑇3 =
Θ
,
2
𝑇5 =
2 + √3
Θ.
4
35
4 ПОСТРОЕНИЕ ЧИСЛЕННОГО РЕШЕНИЯ
4.1 Общий алгоритм решения
Общий алгоритм решения канонической задачи быстродействия
представлен на рис.3.
Рис. 3 Общий алгоритм решения канонической задачи быстродействия.
4.2 Численная реализация аналитического метода
Для численной реализации аналитического метода был выбран
программный продукт maple.
В ходе компьютерных экспериментов создаются разные подходы к
задаче, анализируются частные решения, а также при программировании
36
возможна сортировка фрагментов, которые требуют особой скорости, все это
происходит с помощью программы maple, которая представляет для них
удобную среду. С помощью программ можно создавать интегрированные
среды, которые взаимодействуют с другими системами, а так же используют
универсальные
окончательном
языки
программирования
результате
высокого
произведенных расчетов,
уровня.
для
При
оформления
проделанной работы, можно использовать средства пакета maple, который
предоставит
возможность
визуализировать
полученные
подготовить иллюстрации для публикации.
Ниже представлено численное решение для n=7.
данные
и
38
Таким образом, мы получили следующие результаты для n=7:
1.Время быстродействия
q=32.8311109…57979
первый род управления, так как u= -1.
2. Моменты переключения
3.3654339…14046
8.8933204…52775
15.497374…27115
22.124396…46178
27.749633…28490
31.510280…52274
32.831110…57979
3. Погрешность вычисления составляет
R=.443686…07751∙ 10−48.
39
ЗАКЛЮЧЕНИЕ
Одним из обширных классов является класс экстремальных задач. Он
состоит из задач оптимального управления, задач оптимизации управляемых
процессов, которые имеют большое прикладное значение.
Управляющий орган и объект управления являются основными
частями
структурной
схемы
задач
управления.
Примером
объекта
управления может выступать: технологический процесс, космический
эксперимент, система машин, семейный бюджет и т. д. С момента
происхождения задач управления, управляющее звено прошло немало этапов
прогрессирования−от простейшего регулятора до современной ЭВМ.
В ходе проделанной выпускной квалификационной работе, были
выполнены следующие задачи:
• изучены методы решения задач быстродействия
• изучено решение канонической задачи быстродействия, основанной на
min-проблеме моментов А. А. Маркова
• Построено численное решение канонической задачи быстродействия,
основанной на min-проблеме моментов А. А. Маркова.
Из всего выше перечисленного можно сделать вывод, что принцип
максимума Понтрягина подходит для любой задачи управления (не
обязательно задачи быстродействия), но этот метод не очень удобен в
программировании.
Метод, предложенный Валерием Ивановичем Коробовым, позволяет
решать линейные задачи быстродействия, для систем любой размерности и
удобен для программирования.
Принцип max Понтрягина для задачи быстродействия не очень удобен,
так
как
возникают
проблемы
в
программировании
при
больших
размерностях. Данный подход, основанный на min-проблеме моментов,
позволяет решать задачи любой размерности, все зависит лишь от
возможностей компьютера.
40
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
1.
Атанс, М., Фалб, П. Оптимальное управление. — М.: Машиностроение,
1968. 763 с.
2.
Ахиезер, Н.И. Классическая проблема моментов. М.: Госиздат, физ.-
мат. литературы, 1961. -310 с.
3.
Благодатских В.И. Введение в оптимальное управление (линейная
теория): М.: Высшая школа, 2001. - 239 с.
4.
Благодатских В.И. Линейная теория оптимального управления. -М.
Изд-во МГУ 1978.
5.
Гамкрелидзе Р.В. Основы оптимального управления. Тбилиси: Изд-во
ТбГУ, 1977. - 264 с.
6.
Гамкрелидзе Р.В. Теория оптимальных по быстродействию процессов в
линейных системах // Известия АН СССР. Серия математическая. – 1958. –
Т.22, №4. – С. 447 – 474.
7.
Коробов В.И. Метод функции управляемости. – М., - Ижевск: НИЦ
«Регулярная
и
хаотическая
динамика»,
Институт
компьютерных
исследований, 2007. – 576 с.
8.
Коробов В.И., Иванова Т.И. Отображение нелинейных управляемых
систем специального вида на каноническую систему // Математическая
физика, анализ, геометрия. – 2001. Т. 8, №1. С. 42 – 57.
9.
Коробов,
В.И., Скляр, Г.М.
Проблема моментов Маркова на
минимально возможном отрезке // Докл. АН СССР. 1989. — Т. 308.-№3,-С.
525-528.
10.
Коробова Е.В., Скляр Г.М. Один конструктивный метод отображения
нелинейных систем на линейные // теория функций, функциональный анализ
и их приложения. – 1991. №55. – С. 68 – 74.
11.
Коробов В.И., Скляр Г.М. Оптимальное быстродействие и степенная
проблема моментов //Мат. сборник.-1987. - 134(176), №2(10). – с.186-206.
41
12.
Коробов В.И., Скляр Г.М., Флоринский В.В. О нахождении
оптимального времени и моментов переключения в задаче быстродействия //
Вестник Харьковского университета, серия «Математика, прикладная
математики и механика». – 1999. - № 444, с. 24-43.
13.
Коробов В.И., Флоринский В.В. Методы построения оптимальных по
быстродействию
управлений
для
канонических
управляемых
систем
//Математическая физика, анализ, геометрия. – 1999.- Т.6. № 3/4, с. 264-287.
14.
Крейн М.Г., Нудельман A.A. Проблема моментов Маркова и
экстремальные задачи. М.: Наука, 1973. - 551 с.
15.
Ли Э.Б., Маркус Л. Основы теории оптимального управления.- М.:
Наука, 1971. – 574 с.
16.
Минюк С.А. О точном решении задачи быстродействия в случае
линейных стационарных систем // Дифференциальные уравнения. 1996. - Т.
32, №12. - С. 1645 - 1652.
17.
Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф.
Математическая теория оптимальных процессов. - М.: Наука, 1976. – 362 с.
18.
Скляр
E.B.
О
классе
нелинейных
управляемых
систем,
отображающихся на линейные // Математическая физика, анализ, геометрия.
2001. - Т. 8, №2. - С. 205 – 214
19.
Скляр Е.В., Флоринский B.B. Новые способы нахождения моментов
переключения
для
некоторых
задач
быстродействия
//IV
Крымская
Международная математическая школа "Метод функций Ляпунова и его
приложения". Тезисы докладов. Симферополь. - 1998. - С. 61.
20.
Хайлов E.H. О моментах переключения экстремальных управлений в
линейной задаче оптимального быстродействия // Тр. Ин-та матем. и мех.
УрО РАН. 1996. -4. - С. 225 - 265.
42
ПРИЛОЖЕНИЕ
Численное решение для n=15.
44
Численное решение для n=36.
Отзывы:
Авторизуйтесь, чтобы оставить отзыв