САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
КАФЕДРА КОМПЬЮТЕРНЫХ ТЕХНОЛОГИЙ И СИСТЕМ
Гриднев Лев Владимирович
Выпускная квалификационная работа бакалавра
Синтез оптимальных траекторий движения
в задаче быстродействия
Направление 010400
Прикладная математика и информатика
Научный руководитель,
кандидат физ.-мат. наук,
старший преподаватель,
Моисеев И. А.
Санкт-Петербург
2016
Содержание
Введение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Постановка задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Обзор литературы . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Глава 1. Решение задачи . . . . . . . . . . . . . . . . . . . . . . . . .
Глава 2. Синтез траекторий, удовлетворяющих принципу максимума
2.1. Случаи с одним и двумя моментами переключения скорости
2.2. Случаи с двумя моментами переключения скорости . . . . .
2.3. Случаи с тремя моментами переключения скорости . . . . .
Выводы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Заключение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Список литературы . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Приложение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
.
.
.
.
.
.
.
.
.
.
.
.
3
4
6
7
13
13
17
23
36
37
38
39
Введение
Управляемый объект — объект, поведение которого контролируется человеком. Люди уже давно научились воздействовать на окружающие их процессы, с целью добиться от них необходимых результатов. В повседневной
жизни управляемые процессы и объекты встречаются в различных сферах деятельности человека, например, в экономике, технике, производственной деятельности. Будь то запуск микроволновой печи на конкретное время с определённой мощностью или же вывод спутника на заданную орбиту. Всё это является частью математической теории автоматического управления. С течением
времени к управляемым процессам появляются дополнительные требования.
Спутник хочется запустить на максимально высокую орбиту с минимальным
затратом топлива, а еду в микроволновой печи хочется приготовить за минимальное время. С этого момента появляется новая математическая теория,
которая была создана в середине 50-х годов и получила название «теории
оптимальных процессов». Выдающуюся роль в этом сыграл «принцип максимума», высказанный Л. С. Понтрягиным в качестве гипотезы и подробно
исследованный В. Г. Болтянским, З. В. Гамкрелидзе и Е. Ф. Мищенко [1].
Кроме подходов, использующих методы теории оптимального управления для решения задач того же класса была разработанна теория дифференциальных игр. «Когда собака гонится за кроликом, то даже если она всё время
видит его, она не знает его дальнейшего поведения и может руководствоваться лишь знанием физических возможностей кролика и своих собственных.
Таково своеобразие задачи преследования одного управляемого объекта другим управляемым объектом... Конечно, здесь речь идёт не о животных, а о
технических объектах, но у этих объектов предполагается некоторая свобода
действия, аналогичная свободе воли животных.» [2] Такими словами начинается книга Р. Айзекса «Дифференциальные игры». Ранее, в 1951 году в отчёте
для RAND corporation [3] Айзекс предложил и описал игру «шофёр-убийца».
В данной работе рассматривается задача, основанная на этой игре.
3
Постановка задачи
Поставим задачу оптимального управления. Пусть движение некоторого объекта описывается системой нелинейных дифференциальных уравнений
четвертого порядка
ẋ(t) = V (t) sin ϕ(t) + Wx ,
ẏ(t) = V (t) cos ϕ(t) − Wy ,
(1)
ϕ̇(t) = ωu1 (t),
V̇ (t) = au (t).
2
В данной системе переменными состояния являются x(t) и y(t) — геометрические координаты объекта, ϕ(t) — курсовой угол, V (t) — скорость объекта. Курсовой угол отсчитывается от положительного направления оси ординат до вектора скорости (Vx , Vy )T по часовой стрелке и удовлетворяет ограничению |∆ϕ(t)| 6 2π . Оно означает, что управляемый объект может выполнить полный разворот на любом участке движения. Ограничение на скорость
управляемого объекта представляются в виде V (t) ∈ [V0 , Vmax ], где V0 > 0 —
начальная скорость объекта управления, а Vmax = V0 +2aπ/ω — предельно допустимое значение скорости. Возмущения Wx и Wy — постоянные, не равные
нулю одновременно. Угловая скорость ω и линейное ускорение a объекта —
положительные константы.
Управляющая вектор-функция u(t) = (u1 (t), u2 (t))T в данной задаче
выбирается из класса кусочно-непрерывных функций, где u1 (t) — управление
курсовым углом, а u2 (t) — управление линейной скоростью рассматриваемого
объекта. Оба управления так же должны удовлетворять следующим ограничениям |u1 (t)| 6 1 и |u2 (t)| 6 1.
В этой задаче требуется перевести объект из заданного начального положения (x0 , y0 , ϕ0 , V0 ) в область (0, 0, cos ϕ(T ) = 1, V0 ), где T — конечный
момент времени, за минимальное время, то есть решить задачу оптимального быстродействия. В данной работе рассматривается случай существования
траекторий движения с одним моментом переключения управления курсовым
углом, который также является и моментом переключения управления скоростью.
В природе данная система может представлять различные физические
задачи. Например, эта система моделирует заход самолёта на посадку при
наличии бокового ветра на палубу авианосца либо на взлётно-посадочную
полосу. Так же данная система моделирует задачу стыковки или дозаправки
в воздухе, то есть описывает задачу мягкой встречи. В данном случае скорость космического аппарата к которому осуществляется стыковка или ско4
рость самолёта-заправщика
является поступательной постоянной величиной,
q
равной W = Wx2 + Wy2 .
В данной работе все рассуждения будут проводиться в предположении,
что оптимальная траектория движения (1) существует. Задача определения
условий существования такой траектории требует отдельного рассмотрения.
5
Обзор литературы
Существование данного движения для подобной системы в не-сколько
иной постановке изучалось неоднократно. Так, в статье [4] и в [5] была решена задача вывода объекта в начало координат с произвольным курсовым
углом, нулевыми возмущениями и при отсутствии ограничений на скорость
управляемого объекта. В статье [6] разработан алгоритм построения информационного множества для системы с нулевыми возмущениями. Задача преследования для системы третьего порядка сформулирована в [7]. Игровая постановка задачи (игра «шофёр-убийца») была предложена и описана Р. Айзексом [2, 3]. Система, наиболее близкая к настоящей, решалась в [8]. Различные
варианты игры «шофёр-убийца», её модификации, а также численные методы и алгоритмы её решения описывались в [9, 10]. Принципиальное отличие
настоящей постановки заключается в ограничении на конечное значение курсового угла и в ограничении скорости объекта в конечной точке.
6
Глава 1.
Решение задачи
В качестве математического аппарата для нахождения управления, удовлетворяющего необходимому условию оптимальности (принципу максимума), воспользуемся следующей теоремой [1].
Теорема. Пусть u(t), t ∈ [t0 , t1 ] — допустимое управление, переводящее
фазовую точку из положения x0 в положение x1 , x(t) — соответствующая
траектория, так что x(t0 ) = x0 , x(t1 ) = x1 . Для оптимальности (в смысле
быстродействия) управления u(t) и траектории x(t) необходимо существование такой ненулевой непрерывной вектор-функции ψ(t) = (ψ1 (t), ..., ψn (t)),
удовлетворяющей условиям
dψi
∂H
= − i , i = 1, 2...n,
dt
∂x
(2)
что:
1. Для всех t, t ∈ [t0 , t1 ], функция
H(ψ(t), x(t), u) =
n
X
ψi (t)f i (x(t), u)
(3)
i=1
переменного u ∈ U достигает в точке u = u(t) максимума:
H(ψ(t), x(t), u(t)) = M (ψ(t), x(t)),
2. В конечный момент времени t1 выполнено неравенство
M (ψ(t1 ), x(t1 )) > 0.
(4)
Оказывается, что если величины ψ(t), x(t), u(t) удовлетворяют соотношениям
dxi
∂H
, i = 1, 2...n,
=
dt
∂ψi
и (2), а также (3), то функция M (ψ(t), x(t)) переменного t постоянна, так
что проверку (4) можно проводить в любой момент времени t, t ∈ [t0 , t1 ], а
не только в момент t = t1 .
Из (3) следует, что гамильтониан исходной системы (1) имеет вид
H(x, y, ϕ, V, ψ, u) = ψ1 (V sin ϕ+Wx )+ψ2 (V cos ϕ−Wy )+ψ3 ωu1 +ψ4 au2 . (5)
7
Система, сопряжённая (1), согласно (2), имеет вид
ψ̇1 = 0,
ψ̇ = 0,
2
ψ̇3
ψ̇
4
(6)
= −(ψ1 V cos ϕ − ψ2 V sin ϕ),
= −(ψ1 sin ϕ + ψ2 cos ϕ).
Из условия максимума гамильтониана (5) по управлению следует
(
1, ψ3 (t) > 0,
u1 (t) =
−1, ψ3 (t) < 0,
(
1, ψ4 (t) > 0,
u2 (t) =
−1, ψ4 (t) < 0.
(7)
Проинтегрировав первые два уравнения сопряжённой системы (6), получаем, что ψ1 и ψ2 есть величины постоянные, то есть
ψ1 = C 1 ,
ψ2 = C 2 .
Далее, интегрирование третьего уравнения системы (6) даёт следующий
результата
Z
ψ3 (t) =
(C2 V sin ϕ − C1 V cos ϕ)dt =
(8)
= C2 (x − Wx t) − C1 (y + Wy t) + C3 .
Гамильтониан линеен и однороден по C1 и C2 , а значит можно подвергнуть эти константы условию нормировки, то есть далее будем считать, что
C12 + C22 = 1. Тогда C1 = sin α, C2 = cos α, и четвёртое уравнение системы (6)
запишется в виде
ψ̇4 = −(sin α sin ϕ + cos α cos ϕ) = − cos(ϕ − α).
(9)
Пусть [τ, t] — интервал постоянства управлений u1 и u2 . Интегрируя
8
первые два уравнения из (1), получим
Zt
x(t) =
(V sin ϕ + Wx )dt = x(τ ) + Wx (t − τ ) −
τ
+
V (τ ) cos ϕ(τ ) au2 (τ ) sin ϕ(t) au2 (τ ) sin ϕ(τ )
+
−
,
ωu1 (τ )
ω 2 u21 (τ )
ω 2 u21 (τ )
Zt
y(t) =
(V cos ϕ − Wy )dt = y(τ ) − Wy (t − τ ) +
τ
−
V (t) cos ϕ(t)
+
ωu1 (τ )
(10)
V (t) sin ϕ(t)
−
ωu1 (τ )
V (τ ) sin ϕ(τ ) au2 (τ ) cos ϕ(t) au2 (τ ) cos ϕ(τ )
+
−
.
ωu1 (τ )
ω 2 u21 (τ )
ω 2 u21 (τ )
Так же на интервале [τ, t] интегрируем выражение для ψ̇4 (t) из (9)
ψ4 (t) = ψ4 (τ ) −
Zt
cos(ϕ − α)dt =
τ
= ψ4 (τ ) −
(11)
1
(sin(ϕ(t) − α) − sin(ϕ(τ ) − α)) .
u1 (τ )ω
Справедлива следующая теорема.
Теорема. Пусть существует траектория движения (1) с одной точкой tp переключения управления курсовым углом и скоростью, удовлетворяющая принципу максимума. Тогда в интервалах времени [0, tp ] и [tp , T ] постоянства управления u1 (t) существует не более одной точки переключения
управления u2 (t).
Доказательство. Для начала рассмотрим случай, когда функция ψ4 (t)
обращается в нуль лишь на конечном множестве точек — точек переключения
управления. Иными словами управление u2 (t) на любом участке движения
не принимает нулевого значения. Воспользуемся той же схемой, что и в статье [11]. Пусть t1 ∈ [0, tp ] и t2 ∈ [0, tp ] — точки переключения управления
u2 (t) (для определённости положим t1 < t2 ), таким образом ψ4 (t1 ) = 0 и
ψ4 (t2 ) = 0. Тогда из условия постоянства гамильтониана как функции време-
9
ни на оптимальной траектории [1] следует, что H(t1 ) = H(t2 ) и
C1 (V1 sin ϕ1 + Wx ) + C2 (V1 cos ϕ1 − Wy )+
+ωu1 (C2 (x1 − Wx t1 ) − C1 (y1 + Wy t1 ) + C3 ) =
= C1 (V2 sin ϕ2 + Wx ) + C2 (V2 cos ϕ2 − Wy )+
+ωu1 (C2 (x2 − Wx t2 ) − C1 (y2 + Wy t2 ) + C3 ).
Здесь нижний индекс при ϕ и V обозначает конкретное значение данного
параметра в заданный момент времени, например ϕ1 = ϕ(t1 ), а V2 = V (t2 ).
Используя соотношения (10) и обозначая за u12 значение управления u2 (t) на
интервале [t1 , t2 ], получим
C1 (V1 sin ϕ1 + Wx ) + C2 (V1 cos ϕ1 − Wy )+
+ωu1 (C2 (x1 − Wx t1 ) − C1 (y1 + Wy t1 ) + C3 ) =
= C1 (V2 sin ϕ2 + Wx ) + C2 (V2 cos ϕ2 − Wy )+
+ωu1 (C2 (x1 + Wx (t2 − t1 ) −
V2 cos ϕ2 V1 cos ϕ1
+
+
ωu1
ωu1
au12 sin ϕ2 au12 sin ϕ1
+
−
− Wx t2 ) − C1 (y1 − Wy (t2 − t1 )+
ω 2 u21
ω 2 u21
V2 sin ϕ2 V1 sin ϕ1 au12 cos ϕ2 au12 cos ϕ1
−
+
−
+ Wy t2 + C3 )).
+
ωu1
ωu1
ω 2 u21
ω 2 u21
Отсюда находим
au12 sin ϕ2
au12 sin ϕ1
au12 cos ϕ2
au12 cos ϕ1
C2
− C2
− C1
+ C1
= 0.
ωu1
ωu1
ωu1
ωu1
После проведения элементарных преобразований имеем
ϕ2 + ϕ1
ϕ2 − ϕ1
ϕ2 + ϕ1
ϕ2 − ϕ1
cos
+ 2C1 sin
sin
= 0,
2
2
2
2
ϕ2 + ϕ1
ϕ2 + ϕ1
ϕ2 − ϕ1
sin
C2 cos
+ C1 sin
= 0,
2
2
2
2C2 sin
откуда с учётом того, что α = arctg(C1 /C2 ), следует
sin
ϕ2 − ϕ1
ϕ2 + ϕ1 − 2α
cos
= 0.
2
2
Если первый множитель равен нулю, то ϕ2 − ϕ1 = 2πk , что невозможно,
10
так как t2 не является моментом переключения угла ϕ, а следовательно будет
нарушенно ограничение на модуль изменения курсового угла. Значит нулю
равен второй множитель, что приводит к выводу
ϕ2 + ϕ1 − 2α = π + 2πn.
(12)
Приравнивая далее H(t2 ) и H(tp ) и проведя аналогичные рассуждения, имеем
ϕp + ϕ2 − 2α = π + 2πm.
(13)
Вычитая (12) из (13), получаем
ϕp − ϕ1 = 2π(m − n),
что также невозможно. Таким образом, t1 — единственный момент переключения управления скоростью на интервале [0, tp ]. Аналогично доказывается
для интервала [tp , T ].
Далее рассматривается случай, включающий в себя вариант нулевого
управления скоростью. Здесь также предполагается, что на интервале [0, tp ]
существуют две точки переключения скорости t1 и t2 . Согласно второй системе из (7) ψ4 (t1 ) = ψ4 (t2 ) = ψ4 (tp ) = 0. Если u2 (t) = 0 при t ∈ [0, t1 ], то тогда
используя равенства гамильтонианов H(t1 ) = H(t2 ) = H(tp ), получим, что
такой случай невозможен. Если же u2 (t) = 0 при t ∈ [t1 , t2 ], то используя (11)
для интервала [t1 , t2 ], получаем
ϕ2 − ϕ1
ϕ2 + ϕ1 − 2α
2
sin
cos
= 0,
ψ4 (t2 ) = ψ4 (t1 ) −
u1 ω
2
2
и
ϕ2 + ϕ1 − 2α
ϕ2 − ϕ1
cos
= 0.
2
2
На основании предыдущих рассуждений, имеем
sin
ϕ2 + ϕ1 − 2α = π + 2πn.
(14)
Далее используя равенство H(t2 ) = H(tp ) для интервала времени [t2 , tp ], получаем, что
ϕp + ϕ2 − 2α = π + 2πm.
(15)
Вычитая (14) из (15), имеем
ϕp − ϕ1 = 2π(m − n),
что невозможно. Таким образом, t1 — единственный момент переключения
управления скоростью на интервале [0, tp ] и для случая использования нулевого управления скоростью объекта. Аналогично доказывается и для интервала
11
[tp , T ]. Тем самым, теорема доказана.
Данная теорема позволяет выделить конечное множество всевозможных
вариантов управления для данной задачи. Учитывая ограничения на скорость
объекта управления
V (T ) = V0 ,
V (t) > V0 ,
∀t ∈ [0, T ],
следует заметить, что начальным значением управления скоростью не может
быть u2 = −1, а конечным u2 = +1.
На основании всего этого справедливо следующее.
Следствие. Если начальная точка (x0 , y0 , ϕ0 , V0 ) удовлетворяет условиям теоремы, то возможны следующие варианты движения (здесь интервалы
постоянства управления скоростью объекта отделяются друг от друга запятой, а управления курсовым углом — точкой с запятой):
1. u2 = (+1; −1);
8. u2 = (+1, −1; +1, −1);
2. u2 = (+1; 0, −1);
9. u2 = (+1, −1; 0, −1);
3. u2 = (+1, 0; −1);
10. u2 = (+1, 0; +1, −1);
4. u2 = (0; +1, −1);
11. u2 = (+1, 0; −1, 0);
5. u2 = (0, +1; −1);
12. u2 = (0, +1; −1, 0);
6. u2 = (+1; −1, 0);
13. u2 = (0, +1; 0, −1);
7. u2 = (+1, −1; 0);
Учитывая, что каждый случай включает в себя два варианта начального
значения управления курсовым углом u1 (здесь и далее под u1 будем понимать
начальное значение управления курсовым углом до момента переключения tp ,
то есть u1 = ±1 — const), получаем, что всего здесь представленно 26 возможных варианта управления.
12
Глава 2.
Синтез траекторий, удовлетворяющих
принципу максимума
В данной главе будет проводится анализ каждого возможного варианта управления из следствия, а также для каждого варианта будет построен
функционал, в результате минимизации которого будут найдены параметры
для соответствующего закона управления.
2.1.
Случаи с одним и двумя моментами переключения
скорости
Случай 1. (+1;-1). Проинтегрировав выражения для V̇ (t) и ϕ̇(t) из системы (1), получаем
V0 + at,
0 6 t 6 tp ,
V (t) =
(16)
V + a(2t − t), t 6 t 6 T.
0
p
p
ϕ0 + u1 ωt,
0 6 t 6 tp ,
ϕ(t) =
(17)
ϕ + u ω(2t − t), t 6 t 6 T.
0
1
p
p
Используя выражение (16) можно найти зависимость tp и T . По условию задачи требуется свести конечную скорость объекта к начальной, то есть требуется
выполнение равенства V (T ) = V0 . Таким образом имеем
V (T ) = V0 + a(2tp − T ) = V0 .
2tp − T = 0 ⇒ T = 2tp .
(18)
Используя это соотношение для (17) получаем
ϕT = ϕ0 + ωu1 (2tp − T ) = ϕ0 .
То есть такой вариант управления возможен, если начальный угол равен конечному. Для синтеза рассматриваемого варианта управления будем использовать минимизацию следующего функционала по значению курсового угла в
момент переключения управлений в интервале ϕp ∈ [−2π, 0], если u1 = 1 или
в интервале ϕp ∈ [0, 2π], если u1 = −1.
y(T ) 2
x(T ) 2
f1 (ϕp ) =
+
.
(19)
2
2
Таким образом, остаётся выразить все неизвестные значения данного
13
функционала через значение угла ϕp . С помощью (17) находим
tp =
ϕp − ϕ0
.
u1 ω
(20)
Вычисляя Vp с помощью (16) и учитывая (20), получаем
Vp = V0 + atp = V0 + a
ϕp − ϕ0
.
u1 ω
(21)
Используя (19), (10), (18), (20), (21), получаем следующий функционал
x(T ) 2
y(T ) 2
f1 (ϕp ) =
+
=
2
2
V0
V0 u1 ω + a(ϕp − ϕ0 )
a sin ϕp 2
ϕp − ϕ0
x0
+ Wx
+
−
cos ϕp +
+
=
2
u1 ω
u1 ω
ω2
ω2
ϕp − ϕ0 V0 u1 ω + a(ϕp − ϕ0 )
a cos ϕp
a 2
y0
− Wy
+
sin ϕp +
− 2 .
+
2
u1 ω
ω2
ω2
ω
Если ϕ∗p — точка минимума данного функционала и f1 (ϕ∗p ) = 0, то искомое движение при заданных начальных данных существует.
В приложении приведены примеры траекторий для двух случаев:
1. (x0 , y0 , ϕ0 , V0 ) = (−87488.088, −57563.3018, −6.2832, 20);
u1 = +1, ϕp = −4.8381, ϕT = −6.2832 на рис. 1.
2. (x0 , y0 , ϕ0 , V0 ) = (166257.4101, −44890.8874, 6.2832, 20);
u1 = −1, ϕp = 4.3354, ϕT = 6.2832 на рис. 2.
Случай 2. (+1;0,-1). Для данного варианта управления будем использовать
функционал следующего вида
f2 (ϕp ) = [x(T )]2 + [y(T )]2 .
Используя (10), получаем
V0 cos ϕ0 a sin ϕ1
V0
f2 (ϕp ) = x0 + Wx T +
+
+
−
u1 ω
ω2
u1 ω
2Vp
a(sin ϕ0 − sin ϕp ) 2
V0 sin ϕ0
−
cos ϕp −
+
y
−
W
T
−
−
0
y
u1 ω
ω2
u1 ω
a(1 − cos ϕ1 ) 2Vp
a(cos ϕ0 − cos ϕp ) 2
−
+
sin ϕp −
.
ω2
u1 ω
ω2
14
(22)
Выражая все неизвестные параметры через известные и ϕp , имеем
T =
2ϕp − ϕ0 − ϕT
,
u1 ω
Vp = V0 + a
ϕp − ϕ0
,
u1 ω
(23)
ϕ1 = ϕT + ϕp − ϕ0 .
Подставляя (23) в (22), получаем
V0 cos ϕ0 a sin(ϕT + ϕp − ϕ0 )
2ϕp − ϕ0 − ϕT
+
+
+
f2 (ϕp ) = x0 + Wx
u1 ω
u1 ω
ω2
V0
2(V0 u1 ω + a(ϕp − ϕ0 ))
a(sin ϕ0 − sin ϕp ) 2
+
−
cos ϕp −
+
u1 ω
ω2
ω2
V0 sin ϕ0 a(1 − cos(ϕT + ϕp − ϕ0 ))
2ϕp − ϕ0 − ϕT
−
−
+
+ y0 − W y
u1 ω
u1 ω
ω2
2(V0 u1 ω + a(ϕp − ϕ0 ))
a(cos ϕ0 − cos ϕp ) 2
+
sin ϕp −
.
ω2
ω2
Минимизация данного функционала проводится по переменной ϕp , принадлежащей следующим интервалам
[ϕ0 , ϕ0 + 2π], если u1 = 1,
ϕp ∈
[ϕ − 2π, ϕ ], если u = −1.
0
0
1
Если ϕ∗p — точка минимума данного функционала и f2 (ϕ∗p ) = 0, то искомое движение при заданных начальных данных существует.
В приложении приведены примеры траекторий для двух случаев:
1. (x0 , y0 , ϕ0 , V0 ) = (494873.9976, 363842.73, 0.40841, 20);
u1 = +1, ϕp = 5.6235, ϕ1 = 5.215, ϕT = 0 на рис. 3.
2. (x0 , y0 , ϕ0 , V0 ) = (121394.6019, 53537.7039, 4.4611, 20);
u1 = −1, ϕp = 3.2987, ϕ1 = 5.1208, ϕT = 6.2832 на рис. 4.
Случай 3. (+1,0;-1). Для данного варианта управления будем использовать
функционал следующего вида
f3 (ϕp ) = [x(T )]2 + [y(T )]2 .
15
Используя (10), получаем
V0 cos ϕ0 a sin ϕp
V0
f3 (ϕp ) = x0 + Wx T +
+
+
−
u1 ω
ω2
u1 ω
2V1
a(sin ϕ0 − sin ϕ1 ) 2
V0 sin ϕ0
−
cos ϕp −
−
+
y
−
W
T
−
0
y
u1 ω
ω2
u1 ω
a(1 − cos ϕp ) 2V1
a(cos ϕ0 − cos ϕ1 ) 2
−
+
sin ϕp −
.
ω2
u1 ω
ω2
(24)
Выражая все неизвестные параметры через известные и ϕp , имеем
T =
2ϕp − ϕ0 − ϕT
,
u1 ω
V1 = V 0 + a
ϕp − ϕT
,
u1 ω
(25)
ϕ1 = ϕ0 + ϕp − ϕT .
Подставляя (25) в (24), получаем
2ϕp − ϕ0 − ϕT
V0 cos ϕ0 a sin ϕp
V0
+
+
+
−
f3 (ϕp ) = x0 + Wx
u1 ω
u1 ω
ω2
u1 ω
2(V0 u1 ω + a(ϕp − ϕT ))
a(sin ϕ0 − sin(ϕ0 + ϕp − ϕT )) 2
−
cos ϕp −
+
ω2
ω2
V0 sin ϕ0 a(1 − cos ϕp )
2ϕp − ϕ0 − ϕT
−
−
+
+ y0 − W y
u1 ω
u1 ω
ω2
2(V0 u1 ω + a(ϕp − ϕT ))
a(cos ϕ0 − cos(ϕ0 + ϕp − ϕT )) 2
+
sin ϕp −
.
ω2
ω2
Минимизация данного функционала проводится по переменной ϕp , принадлежащей следующим интервалам
[ϕ0 , ϕ0 + 2π], если u1 = 1,
ϕp ∈
[ϕ − 2π, ϕ ], если u = −1.
0
0
1
Если ϕ∗p — точка минимума данного функционала и f3 (ϕ∗p ) = 0, то искомое движение при заданных начальных данных существует.
В приложении приведены примеры траекторий для двух случаев:
1. (x0 , y0 , ϕ0 , V0 ) = (−213636.3434, −135382.47, −3.2358, 20);
u1 = +1, ϕ1 = −0.69115, ϕp = 2.5447, ϕT = 0 на рис. 5.
16
2. (x0 , y0 , ϕ0 , V0 ) = (−26955.8761, 12950.0275, 4.8066, 20);
u1 = −1, ϕ1 = 4.3982, ϕp = −0.40841, ϕT = 0 на рис. 6.
2.2.
Случаи с двумя моментами переключения скорости
В данном параграфе рассматривается случаи, когда нулевое управление
скоростью присутствует либо на начальном, либо на конечном моменте движения. В качестве функционала для всех последующих вариантов управления
используется следующее выражение
[H(0) + H(T ) − 2H(tp )]2 ,
где, используя (5), имеем
H(0) = C1 (V0 sin ϕ0 + Wx ) + C2 (V0 cos ϕ0 − Wy ) + ψ3 (0)ωu1 + ψ4 (0)au2 (0),
H(T ) = C1 (V0 sin ϕT + Wx ) + C2 (V0 cos ϕT − Wy ) − ψ3 (T )ωu1 + ψ4 (T )au2 (T ),
H(tp ) = C1 (Vp sin ϕp + Wx ) + C2 (Vp cos ϕp − Wy ).
В итоге, применяя (8) для ψ3 (0) и ψ3 (T ), получаем
[V0 (cos(ϕ0 − α) + cos(ϕT − α)) − 2Vp (cos(ϕp − α))+
+u1 ω(C2 (x0 + Wx T ) − C1 (y0 − Wy T )) + a(ψ4 (0)u2 (0) + ψ4 (T )u2 (T ))]2 .
Случай 4. (0;+1,-1). Проинтегрировав выражения для V̇ (t) и ϕ̇(t) из системы (1), получаем
V0 ,
0 6 t 6 tp ,
V (t) = V0 + a(t − tp ),
(26)
tp 6 t 6 t1 ,
V0 + a(2t1 − tp − t), t1 6 t 6 T.
ϕ0 + u1 ωt,
0 6 t 6 tp ,
(27)
ϕ(t) =
ϕ + u ω(2t − t), t 6 t 6 T.
0
1
p
p
Используя выражение (27) можно найти зависимость tp и T . По условию задачи требуется свести конечный курсовой угол к ϕT = 2πk , то есть требуется
выполнение равенства ϕ(T ) = ϕT . Таким образом имеем
ϕ(T ) = ϕ0 + u1 ω(2tp − T ) = ϕT .
T = 2tp −
ϕT − ϕ0
.
u1 ω
17
(28)
Также по условию задачи требуется свести конечную скорость объекта к начальной, то есть требуется выполнение равенства V (T ) = V0 . Таким образом
имеем
V (T ) = V0 + a(2t1 − tp − T ) = V0 .
T + tp
.
2
Также, используя (27) для момента времени tp , получаем
t1 =
tp =
ϕp − ϕ0
.
u1 ω
(29)
(30)
Для синтеза данного варианта управления будем использовать минимизацию
следующего функционала по значению курсового угла в момент времени tp .
f4 (ϕp ) = [H(0) + H(T ) − 2H(tp )]2 =
= [V0 (cos(ϕ0 − α) + cos(ϕT − α)) − 2Vp cos(ϕp − α)+
(31)
+u1 ω(C2 (x0 + Wx T ) − C1 (y0 − Wy T ))+
+ a(ψ4 (0)u2 (0) + ψ4 (T )u2 (T ))]2 .
Таким образом, остаётся выразить все неизвестные значения данного
функционала через значение угла ϕp . Учитывая, что ϕT = πk , имеем
cos(ϕT − α) = cos α = C2 ,
что приводит первое слагаемое (31) к виду
V0 (cos(ϕ0 − α) + cos(ϕT − α)) = V0 (cos(ϕ0 − α) + C2 ).
(32)
Вычисляя ϕ1 с помощью (27), получаем
ϕ1 = ϕ0 + u1 ω(2tp − t1 ).
Подставляя сюда (30), (29), (28), имеем
ϕ1 =
ϕp + ϕT
.
2
(33)
Вычисляя Vp с помощью (26), получаем
Vp = V0 .
(34)
Так как u2 (0) = 0, то значение ψ4 (0) можно не вычислять. Используя (11) для
18
интервала [t1 , T ] и зная, что ψ4 (t1 ) = 0, находим выражения для ψ4 (T )
ψ4 (T ) =
1
(sin(ϕT − α) − sin(ϕ1 − α)).
u1 ω
Используя это и то, что u2 (T ) = −1, а также ϕT = 2πk , то последнее слагаемое в (31) запишется в виде
a(ψ4 (0)u2 (0) + ψ4 (T )u2 (T )) =
a
(C1 + sin(ϕ1 − α)).
u1 ω
(35)
Теперь подставляя (32), (33), (34), (28), (30) и (35) в функцию (31), получаем
f4 (ϕp ) = V0 (cos(ϕ0 − α) + C2 ) − 2V0 (cos(ϕp − α)) +
2ϕp − ϕ0 − ϕT
+u1 ω C2 x0 + Wx
−
u1 ω
2ϕp − ϕ0 − ϕT
−C1 y0 − Wy
+
u1 ω
2
a
ϕp + ϕT
+
.
C1 + sin
−α
u1 ω
2
(36)
Параметр α можно выразить из равенства (13), заменяя ϕ2 значением
ϕ1 из (33). Получаем
3ϕp + ϕT
π
α=
− − πn.
(37)
4
2
Обозначим через tc серединный момент времени между tp и t1 , то есть tc =
(tp + t1 )/2. Так как функция ϕ(t) линейна на интервале [0, tp ], то
tp + t1
ϕp + ϕ1
ϕ(tc ) = ϕ
=
= ϕc .
2
2
Используя это для (37), получим
ϕc − α =
π
+ πn.
2
(38)
Вычисляя (11) для интервала [tp , tc ] используя (38) и (7) зная, что u2 (tc ) = 1,
имеем
1
ψ4 (tc ) =
(sin(ϕc − α) − sin(ϕp − α)) =
u1 ω
1 π
=
sin
+ πn − sin (ϕp − α) > 0.
u1 ω
2
19
Таким образом получаем, что
2k,
n=
2k + 1,
если u1 = 1,
(39)
если u1 = −1.
Исходя из всего этого заключаем, что используя (37) и (39) можно произвести минимизацию функционала (36) по переменной ϕp , принадлежащей
следующим интервалам
[ϕ0 , ϕ0 + 2π], если u1 = 1,
ϕp ∈
[ϕ − 2π, ϕ ], если u = −1.
0
0
1
Если ϕ∗p — точка минимума данного функционала и f4 (ϕ∗p ) = 0, то искомое
движение при заданных начальных данных существует.
В приложении приведены примеры траекторий для двух случаев:
1. (x0 , y0 , ϕ0 , V0 ) = (−104492.4777, 172901.3282, −4.9951, 20);
u1 = +1, ϕp = −1.0681, ϕ1 = −3.6757, ϕT = −6.2832 на рис. 7.
2. (x0 , y0 , ϕ0 , V0 ) = (90355.8818, 168301.8478, −1.6022, 20);
u1 = −1, ϕp = −5.1522, ϕ1 = −2.5761, ϕT = 0 на рис. 8.
Последующие варианты управления в данной главе рассматриваются
подобным образом и ввиду этого, далее полный анализ проводиться не будет, а будет представлен только конечный результат и пару примеров работы
программы для каждого варианта.
Случай 5. (0,+1;-1). Функционал для данного варианта управления
ϕp − ϕT
f5 (ϕp ) = V0 (cos(ϕ0 − α) + C2 ) − 2 V0 + a
cos(ϕp − α)+
u1 ω
2ϕp − ϕ0 − ϕT
−
+u1 ω C2 x0 + Wx
u1 ω
2
2ϕp − ϕ0 − ϕT
a
−C1 y0 − Wy
+
(C1 + sin(ϕp − α)) .
u1 ω
u1 ω
(40)
Параметр α представляется в виде
α=
где из
ϕp + ϕT
π
− − πn,
2
2
π
1
ψ4 (tc ) =
sin (ϕT − α) − sin
+ πn > 0
u1 ω
2
20
(41)
следует, что
n=
2k + 1,
если u1 = 1,
2k,
если u1 = −1.
(42)
Исходя из всего этого заключаем, что используя (41) и (42) можно произвести минимизацию функционала (40) по переменной ϕp , принадлежащей
следующим интервалам
[ϕ0 , ϕ0 + 2π], если u1 = 1,
ϕp ∈
[ϕ − 2π, ϕ ], если u = −1.
0
0
1
Если ϕ∗p — точка минимума данного функционала и f5 (ϕ∗p ) = 0, то искомое
движение при заданных начальных данных существует.
В приложении приведены примеры траекторий для двух случаев:
1. (x0 , y0 , ϕ0 , V0 ) = (−227002.9329, −10133.6225, −3.8642, 20);
u1 = +1, ϕ1 = 0, ϕp = 2.2305, ϕT = 0 на рис. 9.
2. (x0 , y0 , ϕ0 , V0 ) = (228208.2893, 402.0153, −3.8642, 20);
u1 = −1, ϕ1 = −6.2832, ϕp = −8.608, ϕT = −6.2832 на рис. 10.
Случай 6. (+1;-1,0). Функционал для данного варианта управления
ϕp − ϕ0
f6 (ϕp ) = V0 (cos(ϕ0 − α) + C2 ) − 2 V0 + a
cos(ϕp − α)+
u1 ω
2ϕp − ϕ0 − ϕT
+u1 ω C2 x0 + Wx
−
u1 ω
2ϕp − ϕ0 − ϕT
−C1 y0 − Wy
+
u1 ω
2
a
+
(sin(ϕp − α) − sin(ϕ0 − α)) .
u1 ω
(43)
Параметр α представляется в виде
α=
где из
ϕp + ϕ0 π
− − πn,
2
2
1 π
ψ4 (tc ) =
sin
+ πn − sin (ϕp − α) < 0
u1 ω
2
21
(44)
следует, что
n=
2k + 1,
если u1 = 1,
2k,
если u1 = −1.
(45)
Исходя из всего этого заключаем, что используя (44) и (45) можно произвести минимизацию функционала (43) по переменной ϕp , принадлежащей
следующим интервалам
[ϕ0 , ϕ0 + 2π], если u1 = 1,
ϕp ∈
[ϕ − 2π, ϕ ], если u = −1.
0
0
1
Если ϕ∗p — точка минимума данного функционала и f6 (ϕ∗p ) = 0, то искомое
движение при заданных начальных данных существует.
В приложении приведены примеры траекторий для двух случаев:
1. (x0 , y0 , ϕ0 , V0 ) = (100380.2834, −9807.1769, 3.8642, 20);
u1 = +1, ϕp = 5.3721, ϕ1 = 3.8642, ϕT = 0 на рис. 11.
2. (x0 , y0 , ϕ0 , V0 ) = (56727.3852, −4052.7815, 5.4978, 20);
u1 = −1, ϕp = 4.4296, ϕ1 = 5.4978, ϕT = 6.2832 на рис. 12.
Случай 7. (+1,-1;0). Функционал для данного варианта управления
f7 (ϕp ) = V0 (cos(ϕ0 − α) + C2 ) − 2V0 cos(ϕp − α) +
2ϕp − ϕ0 − ϕT
+u1 ω C2 x0 + Wx
−
u1 ω
2ϕp − ϕ0 − ϕT
−C1 y0 − Wy
+
u1 ω
2
a
ϕ0 + ϕp
+
sin
− α − sin(ϕ0 − α)
.
u1 ω
2
(46)
Параметр α представляется в виде
α=
3ϕp + ϕ0 π
− − πn,
4
2
где из
1
ψ4 (tc ) =
u1 ω
π
ϕ0 + ϕp
sin
− α − sin
+ πn
<0
2
2
22
(47)
следует, что
n=
2k,
если u1 = 1,
2k + 1,
если u1 = −1.
(48)
Исходя из всего этого заключаем, что используя (47) и (48) можно произвести минимизацию функционала (46) по переменной ϕp , принадлежащей
следующим интервалам
[ϕ0 , ϕ0 + 2π], если u1 = 1,
ϕp ∈
[ϕ − 2π, ϕ ], если u = −1.
0
0
1
Если ϕ∗p — точка минимума данного функционала и f7 (ϕ∗p ) = 0, то искомое
движение при заданных начальных данных существует.
В приложении приведены примеры траекторий для двух случаев:
1. (x0 , y0 , ϕ0 , V0 ) = (−74679.8469, 84866.7048, −5.3721, 20);
u1 = +1, ϕp = −2.2934, ϕ1 = −3.8327, ϕT = −6.2832 на рис. 13.
2. (x0 , y0 , ϕ0 , V0 ) = (42364.3729, −13152.0168, 6.0004, 20);
u1 = −1, ϕp = 4.0841, ϕ1 = 5.0423, ϕT = 6.2832 на рис. 14.
2.3.
Случаи с тремя моментами переключения скорости
Перед тем, как приступить к рассмотрению следующих случаев, докажем лемму.
Лемма. Пусть для системы (1) управление скоростью объекта имеет
три точки переключения: t1 , tp , t2 такие, что t1 < tp < t2 . Момент времени tp
является так же моментом переключения управления курсовым углом. Если
в данном случае управление удовлетворяет принципу максимума, то значения
курсового угла в моменты времени t1 и t2 будут равны, то есть ϕ1 = ϕ2 .
Доказательство. Моменты времени t1 , tp и t2 являются точками переключения управления скоростью объекта, тогда
ψ4 (t1 ) = ψ4 (tp ) = ψ4 (t2 ) = 0.
Используя (11) для интервала времени [t1 , tp ], имеем следующее
ψ4 (tp ) = ψ4 (t1 ) −
1
(sin(ϕp − α) − sin(ϕ1 − α)) = 0,
u1 ω
а тогда, используя (49), получаем
sin(ϕp − α) − sin(ϕ1 − α) = 2 sin(
ϕp − ϕ1
ϕp + ϕ1 − 2α
) cos(
) = 0.
2
2
23
(49)
Если первый множитель равен нулю, то
ϕp − ϕ1
= πn ⇒ ϕp − ϕ1 = 2πn,
2
что невозможно. Следовательно, приравнивая второй множитель к нулю, получаем представление зависимости угла ϕp через ϕ1
ϕp + ϕ1 − 2α = π + 2πn.
(50)
Проделав аналогичные рассуждения для интервала времени [tp , t2 ], получаем
ϕ2 + ϕp − 2α = π + 2πm.
(51)
Вычитая (50) из (51), получаем
ϕ2 − ϕ1 = 2π(m − n) = 2πk.
(52)
Рассмотрим отдельно два варианта значения u1 .
1. Пусть u1 = 1. Тогда
ϕp > ϕ1
и
ϕp > ϕ2 .
(53)
Пусть в (52) k = 1, то есть ϕ2 = ϕ1 + 2π . Подставляя это в правое
неравенство из (53), получаем
ϕp > ϕ1 + 2π
или
ϕp − ϕ1 > 2π,
что невозможно из-за ограничений на курсовой угол. Пусть теперь в (52)
k = −1, то есть ϕ1 = ϕ2 +2π . Подставляя это в левое неравенство из (53),
получаем
ϕp > ϕ2 + 2π
или
ϕp − ϕ2 > 2π,
что невозможно из-за ограничений на курсовой угол. Таким образом, для
варианта u1 = 1 получаем, что k = 0.
2. Пусть u1 = −1. Тогда
ϕp < ϕ1
и
ϕp < ϕ2 .
(54)
Пусть в (52) k = 1, то есть ϕ1 = ϕ2 − 2π . Подставляя это в левое неравенство из (54), получаем
ϕp < ϕ2 − 2π
или
ϕ2 − ϕp > 2π,
что невозможно из-за ограничений на курсовой угол. Пусть теперь в (52)
k = −1, то есть ϕ2 = ϕ1 − 2π . Подставляя это в правое неравенство
24
из (54), получаем
ϕp < ϕ1 − 2π
или
ϕ1 − ϕp > 2π,
что невозможно из-за ограничений на курсовой угол. Таким образом, для
варианта u1 = −1 получаем, что k = 0.
Следовательно, единственное значение параметра k = 0. Используя выражение (52), получаем ϕ1 = ϕ2 . Что и требовалось доказать.
˙ из сиСлучай 8. (+1,-1;+1,-1). Проинтегрировав выражения для V̇ (t) и ϕ(t)
стемы (1), получаем
V0 + at,
0 6 t 6 t1 ,
V0 + a(2t1 − t),
t1 6 t 6 tp ,
(55)
V (t) =
V0 + a(2t1 − 2tp + t),
tp 6 t 6 t2 ,
V + a(2t − 2t + 2t − t), t 6 t 6 T.
0
1
p
2
2
ϕ0 + u1 ωt,
0 6 t 6 tp ,
ϕ(t) =
(56)
ϕ + u ω(2t − t), t 6 t 6 T.
0
1
p
p
Используя выражение (55) и то, что V (T ) = V0 , имеем
V (T ) = V0 + a(2t1 − 2tp + 2t2 − T ) = V0 .
T = 2t1 − 2tp + 2t2 .
(57)
Также, используя (56) для моментов времени t1 и tp , получаем
tp =
ϕp − ϕ0
,
u1 ω
t1 =
ϕ1 − ϕ0
.
u1 ω
(58)
Используя доказанную ранее лемму, имеем
ϕ1 = ϕ2 ⇒ tp − t1 = t2 − tp ⇒ t1 + t2 = 2tp
и подставляя это в (57), получаем
T = 2tp .
Используя это соотношение для (56), имеем
ϕT = ϕ0 + ωu1 (2tp − T ) = ϕ0 .
25
(59)
То есть такой вариант управления, как и вариант (+1; −1), возможен, если начальный угол равен конечному. Для синтеза данного варианта управления будем использовать минимизацию следующего функционала по значениям курсового угла в моменты t1 и t2 .
f8 (ϕ1 , ϕp ) = [H(0) + H(T ) − 2H(tp )]2 =
= [V0 (cos(ϕ0 − α) + cos(ϕT − α)) − 2Vp (cos(ϕp − α))+
+u1 ω(C2 (x0 + Wx T ) − C1 (y0 − Wy T ))+
(60)
+a(ψ4 (0)u2 (0) + ψ4 (T )u2 (T ))]2 .
Таким образом, остаётся выразить все неизвестные значения данного
функционала через значения углов ϕ1 и ϕp . Учитывая, что ϕ0 = ϕT = ±2π ,
имеем
cos(ϕ0 − α) = cos(ϕT − α) = cos α = C2 ,
что приводит первое слагаемое (60) к виду
V0 (cos(ϕ0 − α) + cos(ϕT − α)) = 2V0 C2 .
(61)
Вычисляя Vp с помощью (55) и учитывая (58), получаем
Vp = V0 + a(2t1 − tp ) = V0 + a
2ϕ1 − ϕ0 − ϕp
.
u1 ω
(62)
Используя (11) для интервалов [0, t1 ] и [t2 , T ] и зная, что ψ4 (t1 ) = ψ4 (t2 ) = 0,
находим выражения для ψ4 (0) и ψ4 (T )
ψ4 (0) =
1
(sin(ϕ1 − α) − sin(ϕ0 − α)),
u1 ω
1
ψ4 (T ) =
(sin(ϕT − α) − sin(ϕ2 − α)).
u1 ω
(63)
Так как ϕ1 = ϕ2 , а ϕ0 = ϕT = ±2π , то с учётом (63) последнее слагаемое
в (60) запишется в виде
a(ψ4 (0)u2 (0) + ψ4 (T )u2 (T )) =
26
2a
(sin(ϕ1 − α) + C1 ) .
u1 ω
(64)
Теперь подставляя (61), (62), (59), (58) и (64) в функцию (60), получаем
2ϕ1 − ϕ0 − ϕp
f8 (ϕ1 , ϕp ) = 2V0 C2 − 2 V0 + a
(cos(ϕp − α)) +
u1 ω
ϕp − ϕ0
ϕp − ϕ0
+u1 ω C2 x0 + 2Wx
− C1 y0 − 2Wy
+
(65)
u1 ω
u1 ω
2
2a
(sin(ϕ1 − α) + C1 ) .
+
u1 ω
Здесь C1 = sin α, а C2 = cos α. Параметр α можно выразить из равенства (50),
получаем
ϕp + ϕ1 π
α=
− − πn.
(66)
2
2
Обозначим через tc серединный момент времени между t1 и tp , то есть tc =
(t1 + tp )/2. Так как функция ϕ(t) линейна на интервале [0, tp ], то
t1 + tp
ϕ1 + ϕp
=
= ϕc .
ϕ(tc ) = ϕ
2
2
Используя это для (66), получим
ϕc − α =
π
+ πn.
2
(67)
Вычисляя (11) для интервала [t1 , tc ] используя (67) и (7) зная, что u2 (tc ) = −1,
имеем
1
ψ4 (tc ) =
(sin(ϕ1 − α) − sin(ϕc − α)) =
u1 ω
1
π
(sin(ϕ1 − α) − sin( + πn)) < 0.
u1 ω
2
Таким образом получаем, что
2k,
если u1 = 1,
n=
2k + 1, если u = −1.
1
=
(68)
Исходя из всего этого заключаем, что используя (66) и (68) можно произвести минимизацию функционала (65) по переменным ϕ1 и ϕp , принадлежащих следующим интервалам
[−2π, 0], если u1 = 1,
[ϕp /2, ϕp ], если u1 = 1,
ϕp ∈
ϕ1 ∈
[0, 2π],
[ϕ , ϕ /2], если u = −1.
если u1 = −1,
p
p
1
Ограничение на значение курсового угла ϕ1 следует из ограничений задачи
27
на скорость объекта. Если (ϕ∗1 , ϕ∗p ) — точка минимума данного функционала и f8 (ϕ∗1 , ϕ∗p ) = 0, то искомое движение при заданных начальных данных
существует.
В приложении приведены примеры траекторий для двух случаев:
1. (x0 , y0 , ϕ0 , V0 ) = (−198608.1033, −25492.2172, −6.2832, 20);
u1 = +1, ϕ1 = −4.681, ϕp = −3.9584, ϕT = −6.2832 на рис. 15.
2. (x0 , y0 , ϕ0 , V0 ) = (208349.9132, 414004.6806, 6.2832, 20);
u1 = −1, ϕ1 = 3.2673, ϕp = 2.1363, ϕT = 6.2832 на рис. 16.
Случай 9. (+1,-1;0,-1). Данный вариант управления позволяет, в отличии от
предыдущего, построить функционал, зависящий только от одного параметра,
а именно от ϕp . Применяя условие V (T ) = V0 , получаем
t1 = (tp − t1 ) + (T − t2 ),
подставляя сюда значения, найденные через функцию ϕ(t)
t1 =
ϕ1 − ϕ0
,
u1 ω
tp − t1 =
ϕp − ϕ1
,
u1 ω
T − t2 =
ϕ2 − ϕT
,
u1 ω
и используя лемму (ϕ1 = ϕ2 ), находим
ϕ1 = ϕ0 + ϕp − ϕT .
Также для скорости объекта в момент времени tp справедливо
Vp = V0 + a
ϕ0 + ϕp − 2ϕT
,
u1 ω
а для конечного момента времени имеем
T =
2ϕp − ϕ0 − ϕT
.
u1 ω
28
На основании всего этого получаем следующий функционал
f9 (ϕp ) = V0 (cos(ϕ0 − α) + C2 ) −
ϕ0 + ϕp − 2ϕT
−2 V0 + a
cos(ϕp − α)+
u1 ω
2ϕp − ϕ0 − ϕT
+u1 ω C2 x0 + Wx
−
u1 ω
2ϕp − ϕ0 − ϕT
−C1 y0 − Wy
+
u1 ω
(69)
2
a
(2 sin(ϕ0 + ϕp − α) − sin(ϕ0 − α) + C1 ) .
+
u1 ω
Параметр α представляется в виде
α=
π
2ϕp + ϕ0 − ϕT
− − πn,
2
2
(70)
где из
π
1
ψ4 (tc ) =
sin (ϕ0 + ϕp − α) − sin
+ πn < 0
u1 ω
2
следует, что
2k,
если u1 = 1,
n=
2k + 1, если u = −1.
1
(71)
Исходя из всего этого заключаем, что используя (70) и (71) можно произвести минимизацию функционала (69) по переменной ϕp , принадлежащей
следующим интервалам
[ϕ0 , ϕ0 + 2π], если u1 = 1,
ϕp ∈
[ϕ − 2π, ϕ ], если u = −1.
0
0
1
Если ϕ∗p — точка минимума данного функционала и f9 (ϕ∗p ) = 0, то искомое
движение при заданных начальных данных существует.
В приложении приведены примеры траекторий для двух случаев:
1. (x0 , y0 , ϕ0 , V0 ) = (−339523.2239, −3961.4317, −2.2305, 20);
u1 = +1, ϕp = 3.55, ϕT = 0 на рис. 17.
2. (x0 , y0 , ϕ0 , V0 ) = (382629.8764, 206936.7107, −4.7532, 20);
u1 = −1, ϕp = −9.9588, ϕT = −6.2832 на рис. 18.
29
Случай 10. (+1,0;+1,-1). Данный вариант управления позволяет построить
функционал, зависящий только от одного параметра, а именно от ϕp . Применяя условие V (T ) = V0 , получаем
t1 + (t2 − tp ) = T − t2 ,
подставляя сюда значения, найденные через функцию ϕ(t)
t1 =
ϕ1 − ϕ0
,
u1 ω
t 2 − tp =
ϕp − ϕ2
,
u1 ω
T − t2 =
ϕ2 − ϕT
,
u1 ω
и используя лемму (ϕ1 = ϕ2 ), находим
ϕ1 = ϕT + ϕp − ϕ0 .
Также для скорости объекта в момент времени tp справедливо
Vp = V0 + a
ϕT + ϕp − 2ϕ0
,
u1 ω
а для конечного момента времени имеем
T =
2ϕp − ϕ0 − ϕT
.
u1 ω
На основании всего этого получаем следующий функционал
f10 (ϕp ) = V0 (cos(ϕ0 − α) + C2 ) −
ϕT + ϕp − 2ϕ0
−2 V0 + a
cos(ϕp − α)+
u1 ω
2ϕp − ϕ0 − ϕT
+u1 ω C2 x0 + Wx
−
u1 ω
2ϕp − ϕ0 − ϕT
−C1 y0 − Wy
+
u1 ω
(72)
2
a
+
(2 sin(ϕp − ϕ0 − α) − sin(ϕ0 − α) + C1 ) .
u1 ω
Параметр α представляется в виде
α=
где из
2ϕp + ϕT − ϕ0 π
− − πn,
2
2
1 π
ψ4 (tc ) =
sin
+ πn − sin (ϕp − α) > 0
u1 ω
2
30
(73)
следует, что
n=
2k,
если u1 = 1,
2k + 1,
если u1 = −1.
(74)
Исходя из всего этого заключаем, что используя (73) и (74) можно произвести минимизацию функционала (72) по переменной ϕp , принадлежащей
следующим интервалам
[ϕ0 , ϕ0 + 2π], если u1 = 1,
ϕp ∈
[ϕ − 2π, ϕ ], если u = −1.
0
0
1
Если ϕ∗p — точка минимума данного функционала и f10 (ϕ∗p ) = 0, то искомое
движение при заданных начальных данных существует.
В приложении приведены примеры траекторий для двух случаев:
1. (x0 , y0 , ϕ0 , V0 ) = (45233.5034, 325274.6291, −4.3323, 20);
u1 = +1, ϕp = −1.1624, ϕT = −6.2832 на рис. 19.
2. (x0 , y0 , ϕ0 , V0 ) = (−247781.0511, 529287.1166, −0.56235, 20);
u1 = −1, ϕp = −5.0171, ϕT = 0 на рис. 20.
Случай 11. (+1,0;-1,0). Данный вариант управления позволяет построить
функционал, зависящий только от одного параметра, а именно от ϕp . Применяя условие V (T ) = V0 , получаем
t1 = t2 − tp ,
подставляя сюда значения, найденные через функцию ϕ(t)
t1 =
ϕ1 − ϕ0
,
u1 ω
t2 − tp =
ϕp − ϕ2
,
u1 ω
и используя лемму (ϕ1 = ϕ2 ), находим
ϕ1 =
ϕp + ϕ0
.
2
Также для скорости объекта в момент времени tp справедливо
Vp = V0 + a
ϕp − ϕ0
,
2u1 ω
а для конечного момента времени имеем
T =
2ϕp − ϕ0 − ϕT
.
u1 ω
31
На основании всего этого получаем следующий функционал
f11 (ϕp ) = V0 (cos(ϕ0 − α) + C2 ) −
ϕp − ϕ0
−2 V0 + a
cos(ϕp − α)+
2u1 ω
2ϕp − ϕ0 − ϕT
+u1 ω C2 x0 + Wx
−
u1 ω
2ϕp − ϕ0 − ϕT
−C1 y0 − Wy
+
u1 ω
2
a
ϕp + ϕ0
sin
− α − sin(ϕ0 − α)
.
+
u1 ω
2
(75)
Параметр α представляется в виде
α=
где из
следует, что
3ϕp + ϕ0 π
− − πn,
4
2
1 π
ψ4 (tc ) =
sin
+ πn − sin (ϕp − α) < 0
u1 ω
2
2k + 1, если u1 = 1,
n=
2k,
если u1 = −1.
(76)
(77)
Исходя из всего этого заключаем, что используя (76) и (77) можно произвести минимизацию функционала (75) по переменной ϕp , принадлежащей
следующим интервалам
[ϕ0 , ϕ0 + 2π], если u1 = 1,
ϕp ∈
[ϕ − 2π, ϕ ], если u = −1.
0
0
1
Если ϕ∗p — точка минимума данного функционала и f11 (ϕ∗p ) = 0, то искомое
движение при заданных начальных данных существует.
В приложении приведены примеры траекторий для двух случаев:
1. (x0 , y0 , ϕ0 , V0 ) = (227952.3535, 153085.1834, 1.0964, 20);
u1 = +1, ϕp = 5.5138, ϕT = 0 на рис. 21.
2. (x0 , y0 , ϕ0 , V0 ) = (214810.8801, −48909.7355, 1.0964, 20);
u1 = −1, ϕp = −2.4666, ϕT = 0 на рис. 22.
32
Случай 12. (0,+1;-1,0). Данный вариант управления позволяет, в отличии от
предыдущих, построить функционал, зависящий от двух параметров, а именно от ϕ1 и ϕp . Для скорости объекта в момент времени tp справедливо
Vp = V0 + a
ϕp − ϕ1
,
u1 ω
а для конечного момента времени имеем
T =
2ϕp − ϕ0 − ϕT
.
u1 ω
На основании всего этого получаем следующий функционал
f12 (ϕ1 , ϕp ) = V0 (cos(ϕ0 − α) + C2 ) −
ϕp − ϕ1
−2 V0 + a
cos(ϕp − α)+
u1 ω
2ϕp − ϕ0 − ϕT
+u1 ω C2 x0 + Wx
−
u1 ω
2
2ϕp − ϕ0 − ϕT
.
−C1 y0 − Wy
u1 ω
(78)
Параметр α представляется в виде
α=
где из
следует, что
ϕ1 + ϕp π
− − πn,
2
2
π
1
ψ4 (tc ) =
sin (ϕ1 − α) − sin
+ πn > 0
u1 ω
2
2k + 1, если u1 = 1,
n=
2k,
если u1 = −1.
(79)
(80)
Исходя из всего этого заключаем, что используя (79) и (80) можно произвести минимизацию функционала (78) по переменным ϕ1 и ϕp , принадлежащей следующим интервалам
[ϕ0 , ϕ0 + 2π],
[ϕ0 , ϕp ], если u1 = 1,
ϕp ∈
ϕ1 ∈
[ϕ − 2π, ϕ ],
[ϕ , ϕ ], если u = −1.
0
0
p
0
1
Если (ϕ1 , ϕp )∗ — точка минимума данного функционала и f12 (ϕ1 , ϕ∗p ) = 0, то
искомое движение при заданных начальных данных существует.
33
В приложении приведены примеры траекторий для двух случаев:
1. (x0 , y0 , ϕ0 , V0 ) = (26025.6385, 53072.9151, 1.8822, 20);
u1 = +1, ϕ1 = 3.1273, ϕp = 4.1989, ϕT = 0 на рис. 23.
2. (x0 , y0 , ϕ0 , V0 ) = (199436.436, 295227.8404, 2.3004, 20);
u1 = −1, ϕ1 = −0.46771, ϕp = −3.4952, ϕT = 0 на рис. 24.
Случай 13. (0,+1;0,-1). Данный вариант управления позволяет построить
функционал, зависящий только от одного параметра, а именно от ϕp . Применяя условие V (T ) = V0 , получаем
tp − t1 = T − t2 ,
подставляя сюда значения, найденные через функцию ϕ(t)
tp − t1 =
ϕp − ϕ1
,
u1 ω
T − t2 =
ϕ2 − ϕT
,
u1 ω
и используя лемму (ϕ1 = ϕ2 ), находим
ϕ1 =
ϕp + ϕT
.
2
Также для скорости объекта в момент времени tp справедливо
Vp = V 0 + a
ϕp − ϕT
,
2u1 ω
а для конечного момента времени имеем
T =
2ϕp − ϕ0 − ϕT
.
u1 ω
На основании всего этого получаем следующий функционал
f13 (ϕp ) = V0 (cos(ϕ0 − α) + C2 ) −
ϕp − ϕT
−2 V0 + a
cos(ϕp − α)+
2u1 ω
2ϕp − ϕ0 − ϕT
+u1 ω C2 x0 + Wx
−
u1 ω
2ϕp − ϕ0 − ϕT
−C1 y0 − Wy
+
u1 ω
2
a
ϕp + ϕT
+
C1 + sin
−α
.
u1 ω
2
34
(81)
Параметр α представляется в виде
α=
3ϕp + ϕT
π
− − πn,
4
2
(82)
где из
1
ψ4 (tc ) =
u1 ω
π
ϕp + ϕT
sin
− α − sin
+ πn
>0
2
2
следует, что
n=
2k + 1,
если u1 = 1,
2k,
если u1 = −1.
(83)
Исходя из всего этого заключаем, что используя (82) и (83) можно произвести минимизацию функционала (81) по переменной ϕp , принадлежащей
следующим интервалам
[ϕ0 , ϕ0 + 2π], если u1 = 1,
ϕp ∈
[ϕ − 2π, ϕ ], если u = −1.
0
0
1
Если ϕ∗p — точка минимума данного функционала и f13 (ϕ∗p ) = 0, то искомое
движение при заданных начальных данных существует.
В приложении приведены примеры траекторий для двух случаев:
1. (x0 , y0 , ϕ0 , V0 ) = (220289.4996, 216955.5682, −0.61782, 20);
u1 = +1, ϕp = 5.5131, ϕT = 0 на рис. 25.
2. (x0 , y0 , ϕ0 , V0 ) = (−105859.9837, 292973.3732, 5.576, 20);
u1 = −1, ϕp = 1.364, ϕT = 6.2832 на рис. 26.
35
Выводы
В результате проведённых исследований было обнаруженно, что если
существует движение, удовлетворяющее принципу максимума, с одним переключением управления курсовым углом, момент переключения которого является также и моментом переключения управления скорости, то, в зависимости
от начальных данных, возможны 13 вариантов траекторий движения с управлением u1 (t) 6= 0 и различными наборами управления u2 (t).
36
Заключение
Для данной системы было доказанно, что при одновременном переключении скорости и курсового угла на интервалах постоянства управления курсовым углом существует не более одной точки переключения скорости. На
основании этого было полученно 13 вариантов движения.
Так как аналитически решить задачу невозможно, то было предложенно
численное решение задачи, причём задачу решения системы трансцендентных уравнений удалось свести к задаче минимизации, в большинстве случаев
одномерной, на заданном интервале, и только в двух случаях к двумерной минимизации. Также была доказанна лемма, утверждающая, что если на всём
участке траектории есть три точки переключения скорости, причём вторая является и точкой переключения курсового угла, то значения курсовых углов в
первый и третий моменты равны.
Часть результатов данной работы было продемонстрированно в докладе на XLVII международной научной конференции аспирантов и студентов
«Процессы управления и устойчивость».
37
Список литературы
[1] Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. М.: Наука, 1969. 384 с.
[2] Айзекс Р. Дифференциальные игры / пер. с англ. В. И. Аркина, Э. Н. Симаковой; под ред. М. И. Зеликина. М.: Мир, 1967. 384 с.
[3] Isaacs R. Games of pursuit. Scientific report of the RAND Corporation. Santa
Monica: RAND Corporation, 1951.
[4] Бердышев Ю. И. Синтез оптимального по быстродействию управления
для одной нелинейной системы четвёртого порядка // Прикл. математика
и механика. 1975. Т. 39. Вып. 6. С. 985–994.
[5] Бердышев Ю. И. Синтез оптимального по быстродействию управления
движением материальной точки в среде с сопротивлением. Автореф.
канд. дис., Свердловск: Урал. науч. центр, 1978. 18 с.
[6] Пацко В. С., Пятко С. Г, Кумков С. И, Федотов А. А. Оценивание движения воздушного судна на основе информационных множеств при неполных замерах координат // Науч. докл. Академия ГА. С.-Петербург, 1999;
ИММ УрО РАН, Екатеринбург. 1999. 70 c.
[7] Розов Н. Х. Постановка задачи оптимального управления. Математика на
службе инженера. Основы теории оптимального управления: сб. статей.
М.: Знание, 1973. С. 6–27.
[8] Reeds J. A., Shepp L. A. Optimal paths for a car that goes both forwards and
backwards // Pacific J. Math. 1990. Vol. 145, No 2. P. 367–393.
[9] Пацко В. С., Турова В. Л. Игра «шофёр-убийца» и её модификации //
Вестник Удмурт. у-та. Вып. 2. Ижевск. 2008. С. 105–110.
[10] Patsko V. S., Turova V. L. Level sets of the value function in differential games
with the homicidal chauffeur dynamics // Game Theory and Applications.
2007. Vol. 12. P. 123–152.
[11] Золотых М. С., Моисеев И. А. Свойства точек переключения управления нелинейной системы четвёртого порядка // Вестник СанктПетербургского университета. Серия 10: Прикладная математика. Информатика. Процессы управления. 2014. № 3. С. 118–124.
38
Приложение
Рис. 1: Случай 1. (+1; −1), u1 = +1.
Рис. 2: Случай 1. (+1; −1), u1 = −1.
39
Рис. 3: Случай 2. (+1; 0, −1), u1 = +1.
Рис. 4: Случай 2. (+1; 0, −1), u1 = −1.
40
Рис. 5: Случай 3. (+1, 0; −1), u1 = +1.
Рис. 6: Случай 3. (+1, 0; −1), u1 = −1.
41
Рис. 7: Случай 4. (0; +1, −1), u1 = +1.
Рис. 8: Случай 4. (0; +1, −1), u1 = −1.
42
Рис. 9: Случай 5. (0, +1; −1), u1 = +1.
Рис. 10: Случай 5. (0, +1; −1), u1 = −1.
43
Рис. 11: Случай 6. (+1; −1, 0), u1 = +1.
Рис. 12: Случай 6. (+1; −1, 0), u1 = −1.
44
Рис. 13: Случай 7. (+1, −1; 0), u1 = +1.
Рис. 14: Случай 7. (+1, −1; 0), u1 = −1.
45
Рис. 15: Случай 8. (+1, −1; +1, −1), u1 = +1.
Рис. 16: Случай 8. (+1, −1; +1, −1), u1 = −1.
46
Рис. 17: Случай 9. (+1, −1; 0, −1), u1 = +1.
Рис. 18: Случай 9. (+1, −1; 0, −1), u1 = −1.
47
Рис. 19: Случай 10. (+1, 0; +1, −1), u1 = +1.
Рис. 20: Случай 10. (+1, 0; +1, −1), u1 = −1.
48
Рис. 21: Случай 11. (+1, 0; −1, 0), u1 = +1.
Рис. 22: Случай 11. (+1, 0; −1, 0), u1 = −1.
49
Рис. 23: Случай 12. (0, +1; −1, 0), u1 = +1.
Рис. 24: Случай 12. (0, +1; −1, 0), u1 = −1.
50
Рис. 25: Случай 13. (0, +1; 0, −1), u1 = +1.
Рис. 26: Случай 13. (0, +1; 0, −1), u1 = −1.
51
Отзывы:
Авторизуйтесь, чтобы оставить отзыв