САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
КАФЕДРА КОМПЬЮТЕРНЫХ ТЕХНОЛОГИЙ И СИСТЕМ
Кроткин Артем Эдуардович
Выпускная квалификационная работа бакалавра
Исследование свойств оптимальных траекторий в
задаче быстродействия
Направление 010400
Прикладная математика и информатика
Научный руководитель,
кандидат физ.-мат. наук,
старший преподаватель
Моисеев И.А.
Санкт-Петербург
2016
Содержание
Введение ........................................................................................................ 3
Постановка задачи ....................................................................................... 5
Обзор литературы ........................................................................................ 6
Глава 1. Исследование свойств траекторий удовлетворяющих принципу
максимума ..................................................................................................... 7
1.1. Свойства начального участка траекторий ................................... 7
1.2.
Свойства
траекторий
содержащих
участки
совместного
переключения управлений курсовым углом и скоростью ............... 11
Выводы ........................................................................................................ 15
Заключение ................................................................................................. 16
Список литературы .................................................................................... 17
2
Введение
В современном мире люди каждый день управляют той или иной
техникой или процессами. И так как прогресс не стоит на месте, то каждый
день
появляются
новейшие
объекты,
которые
требуют
нахождения
различных подходов к управлению ими. Поэтому вопрос управления сегодня
весьма актуален. А так как люди не любят тратить свои усилия и ресурсы
впустую, то они хотят управлять всем оптимально. Но эта проблема возникла
уже очень давно и так как решение этой задачи далеко не всегда было
тривиальным, то изобрели соответствующую математическую теорию,
которая получила название «теория оптимальных процессов». Важнейшую
роль в ней сыграл Л.С. Понтрягин, который сформулировал в 1958 году всем
известный принцип максимума. Позднее принцип доказали Р.В.Гамкрелидзе
и В.Г.Болтянский в частном и общем случаях соответственно.
В жизни, мы стараемся закончить начатые дела, как можно раньше,
поэтому на практике часто показателям качества решения является время, то
есть мы хотим решить задачу быстродействия. Как известно, в случае
линейных систем обыкновенных дифференциальных уравнений принцип
максимума
обеспечивает
необходимые
и
достаточные
условия
для
оптимальности решения. Однако же, когда возникает нелинейность, то мы
прибегают к линеаризации, которая дает весьма хорошие результаты, но
далеко не всегда. В таких случаях приходится прибегать к дополнительным
исследованиям, опирающимся на вид и свойства конкретной нелинейной
системы, благодаря которым иногда удается получить число точек
переключения управления. В предлагаемой работе, приводится пример
такого
исследования.
дифференциальных
Нелинейная
уравнений
описывает
система
физическую
обыкновенных
задачу
захода
самолета при сильном боковом ветре на палубу авианесущего корабля или
сближения двух самолетов для дозаправки, то есть задачу стыковки. В
результате
проведенного
исследования
3
были
выявлены
некоторые
траектории движения данной системы, удовлетворяющие необходимому
условию оптимальности.
4
Постановка задачи
Пусть
движение
объекта
описывается
следующей
системой
обыкновенных дифференциальных уравнений:
̇
̇
(1)
̇
{
Здесь
и
скорость,
̇
- геометрические координаты объекта,
–
– курсовой угол, отсчитываемый от положительного
направления оси ординат до вектора скорости (
стрелке и удовлетворяет ограничению |
|
) по часовой
.
Необходимо перевести объект из начальной точки
заданную область
в
(
, где T – конечный момент
времени. Функционалом качества служит конечное время, следовательно,
нам требуется решить задачу оптимального быстродействия. Также на
систему накладываются следующие ограничения: управляющая векторфункция
выбирается
из
класса
функций, должна удовлетворять ограничениям |
кусочно-непрерывных
|
,|
|
и при
этом не рассматривается ситуация, когда управление равно нулю, скорость
объекта
], где
[
. Последнее условие означает, что
объект может совершить полный разворот, двигаясь равноускорено при
начальной скорости. Остальные параметры являются постоянными:
ускорение,
– угловая скорость,
и
одновременно.
5
–
- возмущения не равны нулю
Обзор литературы
Для данной системы оптимальное по быстродействию движение было
рассмотрено в других постановках неоднократно. Таким образом, в статье
[4] и в [5] была решена подобная задача с нулевыми возмущениями,
произвольным курсовым углом и без ограничений, накладываемых на
скорость. В статье из сборника докладов [1], для системы без возмущений
разработан
алгоритм
преследования
для
построения
движения
множества
описываемого
достижимости.
тремя
Задача
уравнениями
сформулирована в [3]. Задача в игровой постановке (игра "шофер-убийца")
была поставлена Р. Айзексом в работах [6,7]. Система, максимально похожая
в этой постановке, рассматривалась в [8]. Множество вариантов и
модификации игры "шофер-убийца", а также различные алгоритмы для ее
решения и численные методы, описаны в [2,9]. Принципиальное отличие
задачи в данной работе заключается в задании значений в конечный момент
времени курсового угла и скорости, а также в наличии ограничений на них.
6
Глава 1. Исследование свойств траектории
1.1. Свойство начального участка траектории
Рассматривается система следующего вида:
В виде гамильтоновой системы:
(2)
(3)
Для исследований используется принцип максимума [10]:
Теорема.
Пусть
–
переводящее фазовую точку из положения
допустимое
в положение
управление,
, а
–
соответствующая траектория (2), так что
. Для
оптимальности (по быстродействию) управления
и траектории
необходимо существование такой ненулевой непрерывной вектор-функции
) соответствующей функциям
(
и
(3),
что:
1° Для всех
, функция
достигает в точке
переменного
максимума
(
)
2° В конечный момент
(
)
выполнено соотношение
(4)
Оказывается, далее, что если величины
удовлетворяют
системе (2), (3) и условию 2°, то функция
переменного
постоянна, так что проверку соотношения (4) можно проводить не
обязательно в момент
, а в любой момент
В нашем случае гамильтониан системы имеет вид:
(
7
)
(5)
Сопряженная (1) система имеет следующий вид:
̇
̇
(6)
̇
̇
{
Согласно принципу максимума, оптимальное управление имеет вид:
{
{
Далее проинтегрируем первые два из уравнений (6):
В силу линейности и однородности (5) по
и
, положим
, тогда
Теорема.
Пусть
существует
траектория
движения
удовлетворяющая принципу максимума. Тогда на интервале [
], где
первая точка совместного переключения управлений
существует не более одной точки переключения управления
Доказательство. Предположим, что на интервале [
две точки переключения управления
-
и
проинтегрируем первые два уравнения из (1) на интервале [
управлений
и
и
–
,
.
] существуют
. Для начала
] постоянства
:
(7)
8
(1),
(8)
Для упрощения записи введем обозначение:
Также проинтегрируем третье уравнение из сопряженной
системы (6):
∫
∫
̇
(
( ̇
)
)
Используя последнее соотношение, имеем:
(*)
Воспользуемся тем, что гамильтониан как функция времени на
оптимальной траектории постоянен, то есть:
[10]. Рассмотрим моменты
и
:
(
С учетом равенства (*), получим:
9
)
Домножим последнее равенство слева и справа на
:
Откуда придем к следующему выражению:
(
(
)
(
)
(
)
(
)
)(
(
)
(
))
Отсюда следует:
(
где
)
(
)
Из последнего равенства вытекают два варианта. Если
первый сомножитель равен нулю, то
но этот
случай невозможен, так как будет нарушено ограничение, накладываемое на
курсовой угол, при этом ни момент
переключения управления
, ни момент
. Если же второй сомножитель равен нулю,
то
(9).
рассуждения с моментами
не являются точками
и
Проведя
, исходя из того что
аналогичные
,
получим следующее выражение:
Подставив (9) в последнюю формулу, получим:
Из равенства (10) видно, что такого не может быть, потому что оно
нарушает ограничение - |
|
, то есть
является единственной
точкой переключения управления скоростью на интервале [
доказана.
10
]. Теорема
1.2. Свойство траекторий содержащих участки
совместного переключения
Рассмотрим второй промежуток [
]. В статье [11] доказывается, что
в этом промежутке существует не более одной точки переключения
управления
, но не рассмотрена ситуация с отсутствием таких точек. В
этом случае
Воспользуемся тем фактом, что
Имеем:
(11)
(12)
И
Подставим в последнее равенство соотношения (11) и (12) и получим:
11
В равенстве выше сокращается все, кроме последней скобки,
следовательно:
(
)
(
)
Пусть равен нулю второй сомножитель, тогда:
В этом случае
(13)
(14)
Тогда
(
откуда следует, что
)
и
Покажем, что имеет место следующая лемма.
Лемма. Пусть в задаче (1) для траектории удовлетворяющей
принципу максимума существует три идущие подряд точки переключения
управления
-
управления
Тогда
, причем
– является и точкой переключения
Доказательство. Используя приведенную выше схему, легко показать,
что:
и
откуда следует, что
В последнем соотношении возможны 3 варианта: первый –
, второй –
, третий –
12
. Докажем,
что возможен только 3-ий вариант. Пусть
, а тогда
и
. Рассмотрим первый вариант
соответственно
,
а
,
это
нарушает
ограничение,
накладываемое на угол. Если взять второй вариант, получим подобное
нарушение
ограничения
А
.
случай не нарушает никаких ограничений. Если же
3-ий
тогда
В этом случае аналогичным образом получим:
1)
,
3)
.
Здесь видно, что только третий вариант не нарушает ограничений на угол.
Таким образом, показали, что углы в момент
Предположим, что на интервале [
управления
. Так как
переключения
равны. Лемма доказана
] есть одна точка переключения
и
– тоже являются точками
, то воспользовавшись доказанной выше леммой,
получим что
, но это невозможно, так как
, а
[
и
Тогда можно сделать вывод, что на интервале
] отсутствуют точки переключения управления
.
Заметим, что если
, то
и
(
)
. В
последнем равенстве второй сомножитель не может быть равен нулю, потому
что скорость по ограничению не может быть отрицательной, а значит первый
сомножитель равен нулю и тогда
. А тогда
, то есть мы получили
ту же ситуацию, что и в предыдущем случае.
Рассмотрим же ситуацию, когда в промежутке [
] есть точка
переключения управления скоростью. В этом случае:
. (15)
13
Используя рассуждения аналогичные предыдущим, получим:
и
. В последнем равенстве
не может
равняться нулю, потому что между моментами совместного переключения
управлений
и
отсутствует точка переключения управления углом,
следовательно, между ними угол изменяется на
. Вследствие последнего
факта равенство (15) примет вид:
(
)
(16)
Если в равенстве выше первый сомножитель равен нулю, то
.А
. Рассмотрим следующую разницу:
Последнее равенство нарушает ограничение на угол. А значит в равенстве
(16) равен нулю второй сомножитель, откуда следует, что
Справедливо также следующее утверждение:
время прошедшее с
временной отрезок от
, но
до
, где –
. А тогда
до
.
(18), здесь
–
. Подставим (17) в (18):
, следовательно,
Значит
отрезка [
]. Время всего промежутка
время
объект изменяет угол курса на .
14
– середина
, половины , следовательно, за
Выводы
В результате проведенных исследований было доказано, что в случае,
когда первая точка переключения управления
переключения управления
является так же точкой
возможны два варианта траекторий,
удовлетворяющих принципу максимума. Одна траектория содержит только
точки совместного переключения управлений
и
, во втором
варианте между точками совместного переключения находится точка
переключения управления
. В последнем случае возможны так же
варианты движения с отсутствием переключения управления
интервале [
].
15
на
Заключение
Вопрос
об
оптимальности
исследованных
траекторий
остается
открытым. В дальнейших исследованиях нужно попробовать найти другие
траектории и сравнить общее время движения. Также не получится
аналитически определить точки переключения управлений, поэтому нужно
воспользоваться для конкретной задачи численными методами, при этом
следует заметить, что полученные свойства точек переключения управлений,
существенно облегчают эту задачу.
16
Литература
1. Пацко В. С., Пятко С. Г., Кумков С. И., Федотов А. А. Оценивание
движения воздушного судна на основе информационных множеств при
неполных замерах координат // Науч.докл. Академия ГА. С.-Петербург, 1999;
ИММ УрО РАН, Екатеринбург. 1999. 70 с.
2. Пацко В. С., Турова В. Л. Игра "шофер-убийца" и ее модификации //
Вестник Удмурт.у-та. Вып. 2. Ижевск 2008.С. 105–110.
3. Розов Н. Х. Постановка задачи оптимального управления.
Математика на службе инженера. Основы теории оптимального управления:
сб. статей. М.: Знание, 1973. С. 6–27.
4. Бердышев Ю. И. Синтез оптимального по быстродействию
управления для одной нелинейной системы четвертого порядка // Прикл.
математика и механика. 1975. Т. 39, Вып. 6.С. 985–994.
5. Бердышев Ю. И. Синтез оптимального по быстродействию
управления движением материальной точки в среде с сопротивлением.
Автореф. канд. дис., Свердловск: Урал. науч. центр,1978. 18 с.
6. Айзекс Р. Дифференциальные игры / пер. с англ. В. И. Аркина, Э. Н.
Симаковой; под ред. М. И. Зеликина. М.: Мир, 1967, 384 с. (Isaacs R.
Differential games.)
7. Isaacs R. Games of pursuit. Scientific report of the RAND Corporation.
Santa Monica: RANDCorporation, 1951. 00 p.
8. Reeds J. A., Shepp L. A. Optimal paths for a car that goes both forwards
and backwards//Pacific J. Math. 1990. Vol. 145, N 2. P. 367–393.
9. Patsko V. S., Turova V. L. Level sets of the value function in differential
games with the homicidal chauffeur dynamics // Game Theory and Applications.
2007. Vol. 12. P. 123–152.
10. Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е.
Ф. Математическая теория оптимальных процессов., М.: Наука, 1969. 384 с.
11. Моисеев И. А., Золотых М. С. Некоторые свойства точек
17
переключения управления одной нелинейной системы четвертого порядка //
Молодой ученый, 2014. №3(62). С. 14-20.
18
Отзывы:
Авторизуйтесь, чтобы оставить отзыв