Федеральное государственное автономное образовательное учреждение
высшего образования
«Московский физико-технический институт (национальный исследовательский
университет)»
Физтех-школа Аэрокосмических Технологий
Кафедра специальных летательных аппаратов и авиационных информационноизмерительных систем
Направление подготовки: 01.03.02 Прикладные математика и информатика
Направленность (профиль) подготовки: Прикладные математика и информатика
ИНТЕЛЛЕКТУАЛЬНЫЙ АЛГОРИТМ УПРАВЛЕНИЯ
ГРУППОЙ БЕСПИЛОТНЫХ ЛЕТАТЕЛЬНЫХ АППАРАТОВ
(бакалаврская работа)
Студент:
Кривошеин Николай Евгеньевич
______________________________
(подпись студента)
Научный руководитель:
Бухаров Кирилл Дмитриевич,
канд. техн. наук, ст. науч. сотр.
______________________________
(подпись научного руководителя)
Москва 2020
Оглавление
Введение ...................................................................................................................................................... 3
Глава 1. Аналитический обзор источников литературы .......................................................................... 6
1.1
Актуальность и области применения БПЛА .............................................................................. 6
Глава 2. Математическая постановка задачи ........................................................................................... 9
Глава 3. Архитектура стенда .....................................................................................................................10
3.1 Программный стенд – симулятор воздушного боя. Принципы мультиагентного управления.
Поле боя. ................................................................................................................................................10
3.2 Математическая модель движения...............................................................................................11
Глава 4. Технология разработки базового алгоритма для управления БПЛА .....................................12
4.1 Реализация и возможности алгоритма .........................................................................................12
4.2 Сценарии боевых действий агентов под управлением базового алгоритма ............................13
Глава 5. Технология разработки интеллектуального алгоритма для управления БПЛА ....................14
5.1 Функция полезности. Методы построения параметров, значения весовых коэффициентов. .14
5.2 Настройка алгоритма. Функции полезности пространственного положения ...........................15
Глава 6. Оптимизация управления ..........................................................................................................16
6.1 Генетический алгоритм. ..................................................................................................................16
6.2 Функция приспособленности .........................................................................................................16
6.3 Стратегия обучения интеллектуального алгоритма .....................................................................17
6.4 Эффективность представленных методов ....................................................................................18
Глава 7. Командные взаимодействия. ....................................................................................................19
7.1 Алгоритмы целераспределения между союзными БПЛА ...........................................................19
7.2 Эффективность представленных методов ....................................................................................20
Заключение ................................................................................................................................................20
Литература .................................................................................................................................................23
2
Введение
Ключевые слова: имитационная модель, функция идентификации состояния, функция
полезности, генетический алгоритм, групповое управление, оптимизация, группа БПЛА.
Исследования в области задач преследования на плоскости начались с исследования
дифференциальных игр преследования, в которых количество игроков равно 2, одного
называют догоняющим, другого убегающим. Цель догоняющего — приведение вектора z(t)
на заданное множество M за возможно короткое время; цель убегающего — максимально
задержать этот момент. Основополагающие результаты в дифференциальных играх
получены в 1960-е годы в СССР Л. С. Понтрягиным, Н. Н. Красовским, Е. Ф. Мищенко, Б.
Н. Пшеничным и др., в США — Р. Айзексом, Л. Берковицем, У. Флемингом и др.
Первым, кто исследовал дифференциальные игры, стал Руфус Айзекс (работа 1951 года,
впервые опубликована в 1965 году). А одна из первых проанализированных им игр стала
игра «Задача о водителе-убийце». Надо отметить, что сам Айзекс вместо «водителя» и
«пешехода» подразумевал торпеду и увёртывающийся от неё небольшой катер [1].
Актуальность темы исследования определяется ростом количества работ в областях,
связанным с изучением проблем управления групп летательных аппаратов в условиях
ограниченного
пространства,
увеличением
производительности
вычислительных
устройств и уменьшением размеров беспилотных летательных аппаратов.
Задача группы беспилотных летательных аппаратов заключается в поиске и
уничтожении вражеской группы аппаратов в ограниченном пространстве при минимально
возможных собственных потерях. Борьба с группами малых летательных аппаратов в
условиях ограниченного пространства – одна из задач, возникших в последнее время в
связи с развитием малоразмерной беспилотной летательной техники. Требуется углубление
теоретических и практических исследований в области группового управления
беспилотными летательными аппаратами для успешного решения поставленных задач.
Цель данный работы - разработать интеллектуальный алгоритм управления группой
беспилотных летательных аппаратов и показать его эффективность.
Решены следующие задачи:
- Разработан программный стенд для моделирования воздушного боя в условиях
ограниченного пространства;
-
Реализован
базовый
алгоритм
управления,
включающий
в
себя
набор
детерминированных действий для определенных моделей поведения;
- Реализован алгоритм управления, основанный на принципе максимизации функции
полезности;
3
- Разработан метод оптимизации алгоритма управления на принципе максимизации
функции полезности
- Разработан ряд алгоритмов целераспределения для ведения активного воздушного боя
группы беспилотных летательных аппаратов;
Научная новизна работы заключается в том, что:
- Предложено использовать генетические алгоритмы для оптимизации алгоритма
управления
- Показан ряд эффективных для различных задач алгоритмов целераспределения для
системы группового управления.
Теоретическая значимость работы заключается в исследовании новых подходов к
решению задач управления группой агентов.
Практическая значимость работы заключается в реализации управления группой
агентов алгоритмом управления, основанном на принципе максимизации функции
полезности и оптимизированным генетическим алгоритмом.
Апробация работы. Результаты работы прошли апробацию путём обсуждения на одной
международной конференции:
«62 научная конференция МФТИ», г. Москва, ноябрь 2019;
Текст дипломной работы включает в себя 23 страниц, 6 иллюстраций и содержит
аналитический обзор 25 источника.
Работа содержит введение, 7 глав, заключение и список источников.
Во введении сформулированы цель работы и ее актуальность, указаны решенные
задачи, обоснованы научная новизна и теоретическая значимость работы, отмечены
практическая значимость и достоверность результатов, перечислены основные публикации
и конференции.
В главе 1 дан аналитический обзор источников литературы. Рассмотрено 25
источников по теме бакалаврской работы, обоснован выбор направления исследования,
сформулированы нерешенные задачи и намечены пути их решения.
В главе 2 сформулирована постановка задачи.
В главе 3 описывается реализация программного стенда, структура боевого
игрового поля, а также математическая модель движения. В конце главы приводятся
правила ведения воздушных боев симуляции.
В главе 4 описывается технология разработки базового алгоритма для управления
БПЛА. Представлено качественное описание сценариев поведения для различных боевых
ситуаций.
4
В главе 5 описывается технология разработки интеллектуального алгоритма для
управления БПЛА. Приводится описание реализации функции полезности и методы выбора
весовых коэффициентов. Описывается настройка алгоритма для отдельных параметров
функции полезности.
В
главе
6
приводится
описание
оптимизации
управления
и
функции
приспособленности для корректной работы генетического алгоритма для большого числа
симуляций воздушных боев. В конце главы приводится статистика и графики,
отображающие эффективность примененных методов для улучшения результатов
алгоритма, управляющего агентами.
В главе 7 приводится описание групповых взаимодействий. Описывается, как
меняется функция полезности при введении новых агентов в симуляцию боя. Описывается
формирование строя и его влияние на результат боя. Рассказывается про алгоритмы
целераспределения, показывается их эффективность в разных боевых условиях. В конце
приводится статистика и графики, показывающие эффективность представленных методик.
В заключении сформулирована решенная задача, представлены выводы, указаны
дальнейшие пути развития проекта по улучшению эффективности генетического алгоритма
для реализации управления группой БПЛА.
Основные результаты работы получены автором лично и опубликованы в
журнале списка ВАК: М. А. Кудров, К. Д. Бухаров, Э. А. Захаров, Д. Р. Махоткин, Н. Е.
Кривошеин, Н. А. Гришин, В. Семенкин "Интеллектуальный алгоритм управления группой
беспилотных аппаратов" – 2019.
5
Глава 1. Аналитический обзор источников литературы
1.1 Актуальность и области применения БПЛА
Беспилотные летательные аппараты были первоначально разработаны для военных
целей. Их адаптивность в качестве универсальных платформ для зондирования и
транспортировки полезных грузов привела к их растущему распространению в
гражданской сфере. Статья [1] исследует этические аспекты двойного использования
дронов и технологий, связанных с ними. Эти аспекты охватывают проблемы, порожденные
передачей технологий, связанных с беспилотными летательными аппаратами, из военной
области в гражданскую.
Спектр функций, которые выполняют беспилотные летательные аппараты (БПЛА),
достаточно широк – это и разведка, и слежение за объектами, и перехват, и уничтожение
вражеских БПЛА. Книга [2] посвящена нынешней угрозе, которую представляют
террористические и повстанческие действия беспилотных летательных аппаратов, а также
связанные с ними потенциальные угрозы в будущем. БПЛА также используются для
уничтожения целей на земле при помощи подвесного вооружения или при помощи
управляемого самоподрыва [3].
Для управления беспилотными аппаратами традиционно применяются методы
управления БПЛА, использующие различного типа эвристики [4], либо аппарат
дифференциальных игр, как это описано в книге Руфуса Айзекса [5]. Дифференциальные
игры - это конфликтные ситуации с бесконечным множеством альтернатив, поддающиеся
описанию с помощью дифференциальных уравнений. Книга примечательна тем, что в ней
приводится ряд нерешенных задач, с которыми аппарат дифференциальных игр не может
справится. Или на решение таких задач уйдет неисчислимо много времени. В предисловии
книги упоминается отсутствие методов, способных привести решение к окончательному
варианту гарантированно.
Беспилотный
летательный
аппарат
является
отличной
платформой
для
исследования, синтеза и анализа алгоритмов управления [7]. Так что в последние годы
появился ряд работ, посвященных групповому управлению беспилотными летательными
аппаратами: в них отмечено применение «неклассических» методов управления.
Различные задачи группового управления могут решаться с помощью алгоритмов,
получивших название интеллектуальных [8];
Генетический алгоритм [8; 9] - это эвристический алгоритм поиска, используемый
для решения задач оптимизации и моделирования путём случайного подбора,
комбинирования и вариации искомых параметров с использованием механизмов,
6
аналогичных естественному отбору в природе. Отличительной особенностью такого
алгоритма является акцент на использование оператора «скрещивания», который
производит операцию рекомбинации решений-кандидатов. Генетические алгоритмы
широко распространены для решения различных задач оптимизации.
Планирование пути для беспилотных летательных аппаратов от начальной точки к
точке назначения имеет важное значение для конкретных задач навигации. Такие данные
будут способствовать снижению энергопотребления и времени полета транспортного
средства [9]. В статье описывается использование генетического алгоритма для
оптимизации алгоритма определения кратчайшего пути, по которому беспилотник должен
пройти заданный путь, чтобы сэкономить энергию и время, не сталкиваясь с препятствием.
Этот алгоритм является одним из самых эффективных при поиске решений в заданном
пространстве.
Алгоритмы нечеткой логики также показали в последнее время свою эффективность
для задач моделирования и управления [10]. Нечёткая логика — раздел математики,
являющийся обобщением классической логики и теории множеств, базирующийся на
понятии нечёткого множества. Такой инструмент позволяет проецировать дискретные
задачи на непрерывные множества, открывая дополнительные возможности для отработки
алгоритмов управления для соответствующих задач. В частности, алгоритмы нечеткой
логики применяют для реализации автономной системы безопасной посадки беспилотного
летательного аппарата [11]. Нечеткая логика также поспособствовала разработке
искусственного интеллекта, способного решать ряд нетривиальных задач [12]. ИИ имеет
высочайшую производительность и вычислительную эффективность, а также устойчив к
неопределенности и случайности, адаптируем к меняющимся сценариям.
Роевые алгоритмы используют имитацию популяции особей и метод стохастической
оптимизации, который моделирует социальное поведение насекомых в рое [13; 14]. Такая
модель также подразумевает наличие так называемой многоагентной системы, состоящей
из множества интеллектуальных агентов — программ, способных самостоятельно на
протяжении длительного промежутка времени выполнять поставленные задачу.
Так, в статье [6] описывается успешное применение многочисленной группы
беспилотных летательных аппаратов «Рой», который американские военные успешно
испытали в 2017 году. ВМС США продемонстрировали технологию полёта автономных
беспилотников, используя более 100 беспилотных летательных аппаратов «Perdix»,
которые демонстрировали поведение роя, такое как коллективное принятие решений и
адаптивное
формирование
строя.
Причем
агенты
роя
не
являются
заранее
запрограммированными на конкретные тактики или приемы ведения боя – они формируют
7
и принимают решения непосредственно во время воздушного сражения. В связи с такой
особенностью не представляется возможным прогнозировать поведения роя. Поскольку
каждый Perdix общается и взаимодействует со всеми остальными Perdix, рой не имеет
лидера и может приспосабливаться к беспилотным летательным аппаратам, входящим или
выходящим из команды.
Нейросетевые алгоритмы широко применяются для решения разнотипных
современных задач благодаря высокому уровню универсальности и возможности
приспосабливаться к различным типовым проблемам [15; 16]. Одним из главных
преимуществ нейронных сетей также является их способность к обучению. Нейросетевые
алгоритмы применяют для задач анализа и обнаружения объектов на изображениях и видео,
автоматизации управления на производствах, управления отдельными агентами и группами
агентов. Использование нейронных сетей является одним из подходов, направленных на
повышение степени автоматизации управления летательного аппарата его бортовым
электронно-вычислительным оборудованием [15]. Например, с использованием глубокой
сверточной нейронной сети (CNN) можно осуществить автономную навигацию воздушного
беспилотника по заранее определенным траекториям с использованием только визуального
ввода
данных
с
бортовой
камеры
и
без
использования
глобальной
системы
позиционирования (GPS) [16].
Все вышеперечисленные алгоритмы имеют ряд практических применений,
большинство из них уже используются для реализации системы управления реальных
моделей беспилотных летательных аппаратов. Алгоритм, представленный в данной работе,
может быть успешно применен на новых аппаратах, разработанных в студенческом
конструкторском бюро авиационного моделирования
Московского Авиационного
Института по заказу АО «Концерн ВКО «Алмаз-Антей» [25].
Развитие вычислительной техники, выражающееся в миниатюризации аппаратных
средств и увеличении вычислительной мощности, открывает возможность применения
алгоритмов управления, требующих больших вычислительных ресурсов для работы в
режиме реального времени. Применение таких алгоритмов определяет возможность
дальнейшего развития в области управления БПЛА.
8
Глава 2. Математическая постановка задачи
С помощью программного стенда будут проводиться симуляции воздушных боев, в
которых участвуют две команды: синие и красные дроны;
Победа в таком бою засчитывается при уничтожении всех дронов противника при
условии, что, хотя бы один из союзных летательных аппаратов остался на поле
боя.
Ничейный результат засчитывается в двух случаях: при истечении заранее
установленного времени боя и при уничтожении всех активных агентов из обоих
команд.
Уничтожение летательного аппарата происходит при столкновении с другими
объектами симуляции или при выполнении особого условия уничтожения, которое должно
мотивировать летательные аппараты к активным действиям.
Уничтожение происходит при достижении задней полусферы противника союзным
летательным аппаратом. То есть если три компоненты, описывающие взаимное положение
летательных аппаратов относительно друг друга, меньше установленных критических.
Условие уничтожения продемонстрировано на рисунке 1.
Рисунок 1- условие уничтожения противника
9
Глава 3. Архитектура стенда
3.1 Программный стенд – симулятор воздушного боя. Принципы мультиагентного
управления. Поле боя.
Для имитационного исследования алгоритмов группового управления беспилотными
летательными аппаратами разработан специализированный программный стенд, который
моделирует физику полета БПЛА [17] в двумерном пространстве. В ряд его функций
входит: симуляция физического взаимодействия моделей летательных аппаратов между
собой и с объектами окружающей среды, ведение файловой системы логирования, а также
передача связных сообщений между объектами.
Структура стенда представлена на рисунке 2.
Базовый
алгоритм
Интеллектуальный
алгоритм
Система
дообучения
Математические модели движения
объектов
Имитатор
отказов*
Двумерное игровое поле
Имитатор
систем РЭБ*
Обработчик игровых событий
Симулятор воздушного боя
Система
визуализации
Имитатор
наземных систем
целеуказания*
Система
логирования
Рисунок 2 – схематическое представление программного стенда
«Поле боя» представляет собой ограниченную область прямоугольной формы, при
перемещении за границу которой модель БПЛА считается уничтоженной. Также
реализована
возможность
добавления
статичных
объектов
различной
формы
в
произвольных локациях, что может быть применимо для моделирования городской среды.
10
3.2 Математическая модель движения
Модель летательного аппарата отражает основные возможности БПЛА самолетного
типа: скорость движения в допустимом диапазоне, уменьшение энергии движения при
виражах, ограничение максимальной скорости поворота. Математическая модель движения
представлена ниже:
𝑣˙ = 𝑎1 ⋅ 𝑈𝑣𝑒𝑙 − 𝑎2 ⋅ |𝜔| ⋅ 𝑣 − 𝑎3 ⋅ 𝑣 + 𝑊𝑚𝑖𝑛 ;
𝑊𝑚𝑖𝑛 = {0, 𝑣 > 𝑣𝑚𝑖𝑛 ; 𝑎4 ⋅ |𝑣 − 𝑣𝑚𝑖𝑛 |, 𝑣 ≤ 𝑣𝑚𝑖𝑛 }
𝜔˙ = 𝑏1 ⋅ 𝑈𝑡𝑢𝑟𝑛 − 𝑏2 ⋅ 𝜔
Где 𝑎1 ⋅ 𝑈𝑣𝑒𝑙 - отклик на управляющее воздействие
сопротивление
повороту,
−𝑎3 ⋅ 𝑣-
сопротивление
«газ/тормоз»,
движению,
𝑊𝑚𝑖𝑛 -
−𝑎2 ⋅ |𝜔| ⋅ 𝑣 -
поддержание
минимальной скорости. 𝑏1 ⋅ 𝑈𝑡𝑢𝑟𝑛 - отклик на поворот, −𝑏2 ⋅ 𝜔- сопротивление повороту.
Управление производится с помощью изменения двух параметров, отвечающих за
скорость и поворот вокруг оси.
Управление скоростью осуществляется посредством задания параметру 𝑈𝑣𝑒𝑙 значения из
вещественного отрезка [0, 1], интерпретирующего диапазон значений “отсутствие тяги /
полный газ”. При присвоении этому управляющему параметру значения 0 при
прямолинейном движении скорость модели летательного аппарата стремится к
минимальной скорости аппарата𝑉𝑚𝑖𝑛 ; при задании 𝑈𝑣𝑒𝑙 значения 1 скорость стремится к
максимальной скорости 𝑉𝑚𝑎𝑥 .
Управление
поворотом
осуществляется
путем
изменения
параметра
𝑈𝑡𝑢𝑟𝑛 в
вещественном диапазоне значений [-1, 1]. Этот параметр отражает изменения угловой
скорости модели. Присвоение 𝑈𝑡𝑢𝑟𝑛 значения -1 означает поворот по часовой стрелке с
максимальной угловой скоростью 𝜔 = 𝜔𝑚𝑎𝑥 ;𝑈𝑡𝑢𝑟𝑛 =1 означает поворот против часовой
стрелки с максимальной угловой скоростью.
Построенная таким образом математическая модель реализует поведение типа
“самолет”. Модель испытывает сопротивление движению пропорционально скорости, что
в целом отражает характер сопротивления воздуха. Достижение максимальной скорости
происходит плавно [18]. При поворотах происходит уменьшение скорости в зависимости
от поступательной и угловой скорости, что необходимо для реализаций тактик боя с
превосходством над противником по скорости [19].
Каждая модель ЛА геометрически представляет собой круг радиусом 𝑟𝑜𝑏𝑗 , и считается,
что произошло столкновение двух объектов, если расстояние между двумя объектами
становится меньше 2𝑟𝑜𝑏𝑗 .
11
Глава 4. Технология разработки базового алгоритма для управления
БПЛА
4.1 Реализация и возможности алгоритма
Для оценки эффективности различных алгоритмов управления создан базовый алгоритм,
реализующий поведение активных мишеней.
Базовый алгоритм представляет собой
алгоритм реализующий набор сценариев поведения для совокупности состояний
управляемого объекта.
Переход объекта в одно из состояний из выбранного набора
продуцирует определенное заранее действие, то есть реализует одно из утвержденных
продукционных правил [20]. Например, в случае приближения к стене на критическое
расстояние, модель принимает состояние “опасность столкновения со стеной”, и
производится маневр уклонения от столкновений. Когда же расстояние до стены
увеличивается до безопасного, объект вновь переходит в состояние "поиск целей". Модели
БПЛА,
осуществляющие
перемещение
согласно
этому
алгоритму,
обладают
возможностью:
уклоняться от столкновений с противниками и союзниками, избегать покидание
поля боя;
выбирать ближайшего противника и производить маневр уничтожения;
выявлять опасное приближение противника и выполнять маневр уклонения.
12
4.2 Сценарии боевых действий агентов под управлением базового алгоритма
Маневр уничтожения [21] осуществляется путем следования по направлению к точке,
расположенной позади противника на установленном расстоянии. Принцип выполнения
маневра проиллюстрирован на рисунке 3. Практическое применение данного алгоритма
показывает, что для моделей ЛА типа “самолет” для всех возможных конфигураций
взаимного расположения происходит поражение противника; в ситуации, когда
противники движутся встречным курсом, после сближения с противником производится
маневр уклонения, после которого модель ЛА производит маневр уничтожения.
Рисунок 3 – маневр уничтожения базового алгоритма
13
Глава 5. Технология разработки интеллектуального алгоритма для
управления БПЛА
5.1 Функция полезности. Методы построения параметров, значения весовых
коэффициентов.
В основе алгоритма управления моделью БПЛА, реализующего интеллектуальный
подход к управлению, лежит принцип оптимизации функции полезности, определяющей
состояние управляемого объекта [22] по таким параметрам, как пространственное
положение
относительно
противников,
союзников
и
препятствий.
Кроме
того,
предполагается, что воздушные маневры на высоких скоростях более эффективны, чем на
низких. Управление, таким образом, осуществляется согласно следующему алгоритму:
определяется оценка функции полезности для текущего состояния,
осуществляется краткосрочный прогноз состояния при исполнении возможных
управляющих воздействий,
определяется оценка функции полезности для возможных состояний,
осуществляется выбор того управляющего воздействия, которое приводит к
максимуму функции полезности.
Функция полезности определяется как аддитивная функция вида:
𝑄 = 𝑎1 ∗ 𝑞1 + 𝑎2 ∗ 𝑞2 + 𝑎3 ∗ 𝑤 + 𝑎4 ∗ 𝑠
Здесь 𝑞1 - функция полезности служит для оценки пространственного положения
относительно противников, 𝑞2 - функция полезности для оценки пространственного
положения
относительно
союзников,
пространственного положения
𝑤
-
функция
полезности
для
оценки
относительно препятствий, 𝑠 - функция полезности,
учитывающая скорость управляемого объекта, 𝑎1 , 𝑎2 , 𝑎3 , 𝑎4 - весовые коэффициенты.
Функция полезности для параметра «взаимное расположение со всеми союзниками»
может быть упрощена, если учитывать только пространственное положение ближайшего
из союзников. Компонента 𝑞2 для взаимного расположения с противниками также
учитывается только по одному из противников, выбор которого производится системой
распределения целей.
Функция полезности для «пространственного расположения ЛА» – это функция трех
переменных 𝑞 = 𝑞(𝑅, 𝛼, 𝛽), где 𝑅 - расстояние между центрами объектов, 𝛼 - угол между
векторами скорости двух объектов, 𝛽 - угол между вектором скорости первого ЛА и
вектором, соединяющим центры первого и второго ЛА.
Компонента 𝑤 - функция
одной переменной 𝑤 = 𝑤(𝑟), где 𝑟 - минимальное из
расстояний до препятствий.
Компонента 𝑠- функция, зависящая от скорости объекта 𝑠 = 𝑠(𝑣).
14
5.2 Настройка алгоритма. Функции полезности пространственного положения
Первоначальная настройка всех компонент функции полезности и значение числовых
параметров осуществляется эмпирически, с опорой на общее понимание тактики боя и
маневренных возможностей моделей БПЛА. Непрерывность функций обеспечивается
линейной интерполяцией по значениям дискретной функции в окрестности интересующей
точки.
Функция 𝑞1 , отражающая оценку положения БПЛА относительно противника, построена
на основании следующих положений:
функция полезности достигает максимального значения в положении, когда
противник находится впереди и следует в том же направлении
функция полезности достигает минимального значения, когда противник находится
позади и следует в том же направлении
функция полезности возрастает при уменьшении расстояния до противника до тех
пор, пока расстояние не меньше критического, означающего опасное сближение
Построение функции 𝑞2 оценки взаимного положения с союзными объектами опирается
на следующую интерпретацию тактики:
сближение с союзником означает уменьшение функции полезности, если расстояние
между объектами меньше критического, означающего опасное сближение
движение встречным курсом означает уменьшение функции полезности при
уменьшении расстояния
на большом удалении пространственная ориентация союзника не имеет значения
Для компоненты 𝑤, отвечающей за оценку местоположения относительно препятствий,
значение функции полезности остается постоянным при удалении БПЛА от препятствия на
расстояние большее некоторого критического. При приближении к препятствию на
расстояние меньшее критического функция полезности экспоненциально убывает при
уменьшении расстояния.
Функция полезности 𝑠 возрастает при увеличении скорости линейным образом.
Весовые коэффициенты 𝑎1 , 𝑎2 , 𝑎3 , 𝑎4 подобраны эмпирически так, чтобы поведение
управляемых БПЛА было нацелено на активную борьбу с объектами-противниками с
достаточной степенью осторожности, обеспечивающей безопасное маневрирование в
условиях ограниченного пространства и плотного заполнения поля боя как союзными, так
и вражескими объектами.
15
Глава 6. Оптимизация управления
6.1 Генетический алгоритм.
Оптимизация алгоритма управления осуществляется на основе настройки посредством
имитации эволюционного отбора [23; 24].
Значения компонент функции полезности и
весовых коэффициентов преобразуются в единый вектор, который интерпретируется как
геном. Размерность генома в рассматриваемом случае составляет величину порядка 10000.
Значения компонент функции полезности и весовых коэффициентов, полученные при
ручной настройке алгоритма, используются как опорные для построения первоначального
генома. В первую эпоху оптимизации первоначальный геном используется для генерации
100 новых геномов, полученных при помощи небольших случайных изменений компонент.
Для всех вариаций генома производится большое количество симуляций боев. Среди всех
мутаций генома отбирается тот, который обеспечивает наибольшую эффективность по
значению функции приспособленности. Этот геном используется как опорный для новой
эры эволюционного отбора.
6.2 Функция приспособленности
Функция приспособленности, использующаяся при оптимизации, должна адекватно
отображать исход большого количества симуляций боев и показывать улучшение или
ухудшение работы алгоритма. Ценность «победы» больше, чем «ничьей», ценность
«ничьей» больше ценности «поражения». Кроме того, более эффективным считается
алгоритм, представляющий выигрыш по быстродействию. Предлагается следующий вид
функции приспособленности:
(𝑊 − 0.5 ⋅ 𝐷 − 𝐿) 0.1 ⋅ ∑𝑖=𝑁
𝑖=1 𝑡𝑖
𝐹=
−
𝑁
𝑁⋅𝑇
Где 𝑁 - общее количество произведенных симуляций боев, 𝑊 - количество побед, 𝐷 количество ничьих, 𝑡𝑖 - время, затраченное на симуляцию боя, 𝑇 - максимальное время
одного боя.
16
6.3 Стратегия обучения интеллектуального алгоритма
Перед непосредственным применением представленного алгоритма для реализации
управления группой агентов необходимо провести ряд дорабатывающих процедур, от
предварительной настройки до оптимизации. Таким образом стратегия обучения
интеллектуального алгоритма выглядит следующим образом:
Симуляции воздушных боев проводятся с помощью программного стенда, в ряд задач
которого входит контроль моделей движения аппаратов, модели окружающей среды,
просчет значений функций полезности, реализующей тактические маневры, а также
поддержка модуля принятия взвешенного решения.
При первом запуске оптимизации управления, интеллектуальный алгоритм управляет
группой агентов непосредственно с помощью ручной предварительной настройки. На
данном этапе алгоритм не имеет возможности стабильно эффективно проводить воздушные
бои против беспилотных летательных аппаратов под управлением базового алгоритма.
С течением генерации новых геномов конфигурации управления интеллектуального
алгоритма его эффективность значительно повышается, происходит стратегическое
дообучение. Малоэффективные геномы отбрасываются, и совершенствуется только один,
от эпохи к эпохе работы генетического алгоритма.
Накопленный
стратегический опыт
(база данных)
Стратегическое
дообучение
Предсказание
будущего
Генетический алгоритм, выигрыша
создающий новые
геномы
Действие
Модель движения
аппарата (объект)
Команды
управления
Модуль принятия
взвешенного
решения
Модель
окружающей
среды
Состояния
всех
объектов
Мгновенное
дообучение
Стратегия обучения интеллектуального алгоритма представлена ниже – на рисунке 4.
Улучшение
мгновенной
позиции Функция полезности,
реализующая
тактические приемы
Рисунок 4 - Стратегия обучения интеллектуального алгоритма
17
6.4 Эффективность представленных методов
Статистика за 1000 симуляций боев «один на один» на разных этапах работы
генетического алгоритма оптимизации представлена ниже – на рисунке 5.
Рисунок 5 – статистика за 1000 симуляций боев «один на один»
18
Глава 7. Командные взаимодействия.
7.1 Алгоритмы целераспределения между союзными БПЛА
Распределение целей между летательными аппаратами группы осуществляется в
соответствии с одним из алгоритмов целераспределения. Эти алгоритмы не учитывают
внутренние свойства объектов, и опираются только на информацию о количестве союзных
и вражеских ЛА, их положение и ориентацию. Среди возможных алгоритмов
рассматриваются следующие:
“Все на одного”: всем союзникам указывается один и тот же случайно выбранный
вражеский объект в качестве цели. После его уничтожения происходит назначение
нового случайно выбранного вражеского летательного аппарата в качестве цели.
“Динамический выбор цели”: в начале боя не происходит назначение цели, каждый
объект следует за той целью, уничтожение которой оценивается алгоритмом как
наиболее вероятное в данный момент времени. Цель может меняться в течение боя,
если вероятность уничтожения этой цели будет выше, чем у предыдущей цели.
“Статический выбор цели”: каждому союзному объекту в начале боя назначается
по одной цели, которую агент под управлением интеллектуального алгоритма
преследует до ее уничтожения. После этого производится назначение новой цели.
19
7.2 Эффективность представленных методов
Для трех алгоритмов целераспределения проведена оптимизация всех компонент
функций полезности. Результаты симуляционных экспериментов показали, что отмечен
существенный прирост эффективности алгоритма управления. Среди трех алгоритмов
целераспределения наиболее эффективным оказался “статический выбор цели”, далее
следуют, соответственно, “все на одного” и “динамический выбор цели”.
В процессе настройки алгоритмов обнаружилось, что управляемые объекты
начинают реализовывать некоторые тактические приемы, не заложенные изначально в
алгоритм управления. Алгоритм управления «подстраивается» под особенности базового
алгоритма, используя такие тактические уловки для уничтожения противников, как
движение на максимальной скорости к границе области и последующее резкое торможение
с уходом в сторону, или выход в лобовую атаку на одного врага, когда другой преследует
на небольшом расстоянии сзади.
Статистика за 1000 симуляций командных боев представлена на рисунке 6.
Рисунок 6 – статистика за 1000 симуляций командных боев
Продемонстрированная выше статистика явно показывает алгоритм «статическое
распределение целей», как самый эффективный по процентному соотношению побед в
рамках предложенных правил проведения боев. Однако алгоритм целераспределения «все
на одного» оказался самый результативным по числу оставшихся в конце симуляции
агентов на поле боя при победе.
20
Такие
низкие
показатели
эффективности
алгоритма
целераспределения
«динамическое распределение» обусловлено особенностью построения и реализации
функции полезности. В других алгоритмах распределение целей происходит только в
случае уничтожения конкретной цели, не опираясь на значение функции полезности. В
течение боя агенты под управлением интеллектуального алгоритма переходят в другое
положение, которое выгодно только в краткосрочной перспективе. Таким образом одна
модель летательного аппарата может поменять цель следования десятки раз, пока не
произойдет ее уничтожение. Из-за таких маневров и происходит потеря строя, теряются
стратегически выгодные для атаки позиции.
21
Заключение
Область исследования групповых взаимодействий ЛА является перспективным и
практически значимым направлением. К нему относятся, в том числе, задачи группового
управления беспилотными летательными аппаратами, исследование некоторых аспектов
которых проводилось в рамках описанной в данной статье работы.
Для исследования алгоритмов управления разработан программный стенд для
моделирования воздушного боя в условиях ограниченного пространства. Стенд реализует
имитационную модель динамики управляемых объектов, и применим для количественной
оценки качества работы алгоритмов группового управления.
Реализован базовый алгоритм, включающий в себя набор детерминированных
действий для определенных моделей поведения, и использующийся для управления
контрольной группы объектов–мишеней.
Реализован алгоритм управления, основанный на принципе максимизации функции
полезности. Алгоритм настраивается посредством генетического алгоритма. В результате
настройки алгоритма получен прирост эффективности до 30% для различных алгоритмов
целераспределения.
Показано, что наиболее эффективным алгоритмом среди трех рассмотренных
алгоритмов целераспределения для системы группового управления является алгоритм
“статический выбор цели”.
Дальнейшее развитие исследований предполагает модификацию физической модели
с целью повышения реалистичности динамики движения объектов, разработку алгоритмов
управления, реализующих иные представления функции полезности и методы ее
оптимизации, конкурентное обучение алгоритмов управления для определения наиболее
эффективных.
В будущем планируется модификация уравнений движения объектов, базового
алгоритма управления и интеллектуального алгоритма управления, разработка новых
интеллектуальных
алгоритмов
с
применением
нейронных
сетей,
применение
интеллектуального алгоритма на реальных моделях беспилотных летательных аппаратов.
В дальнейшем также запланирована модификация групповых взаимодействий:
формирование первичных, вторичных задач для управления группой агентов и проведение
детального сравнения с существующими алгоритмами управления группой агентов по
эффективности.
22
Литература
1. Novitzky P., Kokkeler B., Verbeek P. The Dual-use of Drones Tijdschrift voor Veiligheid
2018 (17) 1-2 doi: 10.5553/TvV/18727948201801710200
2. Bunker R. J. TERRORIST AND INSURGENT UNMANNED AERIAL VEHICLES: USE,
POTENTIALS, AND MILITARY IMPLICATIONS // Strategic Studies Institute and U. S.
Army War College Press, 2015
3. Копытин В. Война дронов. Почему террористы в Сирии всё чаще используют
беспилотники? // LIFE [Электронный ресурс] 2018, URL:
https://life.ru/t/сирия/1076718/voina_dronov_pochiemu_tierroristy_v_sirii_vsio_chashchie_i
spolzuiut_biespilotniki (дата обращения: 09.06.2019).
4. Петросян Л.А., Рихсиев Б.Б. Преследование с простым движением. М.: Наука, 1991. 96 с.
5. Айзекс Р. Дифференциальные игры. М.: Мир, 1967. - 480 с.
6. Majumdar D. U.S. Military Successfully Tested Its Latest Super Weapon: ‘The Swarm’ //
The National Interest [Электронный ресурс] - 9.01.2017 - URL:
https://nationalinterest.org/blog/the-buzz/us-military-successfully-tested-its-latest-superweapon-%E2%80%98the-19002 (дата обращения: 09.06.2019).
7. Zulu A., John S. A. Review of Control Algorithms for Autonomous Quadrotors // Open
Journal of Applied Sciences, 2014 - 10 с.
8. Khuwaja K., Lighari N., Tarca I. C., Tarca R. C. PID Controller Tuning Optimization with
Genetic Algorithms for a Quadcopter // Recent Innovations in Mechatronics (RIiM) Vol. 5.
(2018). No. 1.
9. Galvez R. L., Dadios E. P., Bandala A. A. Path Planning for Quadrotor UAV Using Genetic
Algorithm // 7th IEEE International Conference Humanoid, 2014 - 5 c.
10. Пегат А. Нечеткое моделирование и управление / А. Пегат ; пер. с англ. - 2-е изд. - М.:
БИНОМ. Лаборатория знаний, 2015.- 798 с. (Andrzej P., 2001. Fuzzy Modeling and
Control. Physica-Verlag Heidelberg. 728 p.)
11. Talha M., Asghar F., Rohan A., Rabah M., Kim S. H. Fuzzy Logic-Based Robust and
Autonomous Safe Landing for UAV Quadcopter // Arabian Journal for Science and
Engineering, 2018 - 13 c.
12. Ernest N., Carroll D., Schumacher C., Clark M., Cohen K., Lee G. Genetic Fuzzy based
Artificial Intelligence for Unmanned Combat Aerial Vehicle Control in Simulated Air
Combat Missions // Journal of Defense Management, 2016. - 7 с.
23
13. Водолазский И. А., Егоров А. С., Краснов А. В. Роевой интеллект и его наиболее
распространённые методы реализации // Молодой ученый. — 2017. — №4. — С. 147153. — URLhttps://moluch.ru/archive/138/38900/ (дата обращения: 9.06.2019).
14. Иванов Д. Я. МЕТОДЫ РОЕВОГО ИНТЕЛЛЕКТА ДЛЯ УПРАВЛЕНИЯ ГРУППАМИ
МАЛОРАЗМЕРНЫХ БЕСПИЛОТНЫХ ЛЕТАТЕЛЬНЫХ АППАРАТОВ // Известия
Южного федерального университета. Технические науки, 2011 - 9 c.
15. Кореванов С. В., Казин В. В. ИСКУССТВЕННЫЕ НЕЙРОННЫЕ СЕТИ В ЗАДАЧАХ
НАВИГАЦИИ БЕСПИЛОТНЫХ ЛЕТАТЕЛЬНЫХ АППАРАТОВ // Научный вестник
Московского государственного технического университета гражданской авиации, 2014
- 4 с.
16. Amer K., Samy M., Shaker M., ElHelw M. Deep Convolutional Neural Network-Based
Autonomous Drone Navigation // Center for Informatics Science, 2019 - 8 c.
17. Hostmark J. B. Modelling Simulation and Control of Fixed-wing UAV: CyberSwan //
Institutt for teknisk kybernetikk, 2007 - 106 c.
18. Бесекерский В.А., Попов Е.П.4-е изд // Теория систем автоматического управления. —
СПб.: Профессия, 2003. — 752 с.
19. Петров В. Маневрирование в воздушном бою. // Зарубежное военное обозрение, N1,
1985 [Электронный ресурс] - 9.01.2017 - URL: http://lockon.spb.ru/manevr.html (дата
обращения: 9.06.2019).
20. Подзоров С. Ю. Курс лекции по теории алгоритмов НГУ, 2003 – 2004.
21. Бабич В. К. Воздушный бой (зарождение и развитие) // Военное издательство, 1991 95 с.
22. Rubinstein A. Lecture Notes in Microeconomic Theory. — 2nd. — Princeton University
Press, 2013. — 153 с. — ISBN 978-0-691-15413-8.
23. Климко Е. Г., ГЕНЕТИЧЕСКИЙ АЛГОРИТМ КАК РАЗНОВИДНОСТЬ
ЭВОЛЮЦИОННОГО АЛГОРИТМА // Радиоэлектроника и информатика, 2002 - 4 с.
24. Батищев Д.И., Неймарк Е.А., Старостин Н.В. Применение генетических алгоритмов к
решению задач дискретной оптимизации // Учебно-методический материал по
программе повышения квалификации «Информационные технологии и компьютерное
моделирование в прикладной математике» Нижний Новгород, 2007. - 85 с.
25. Испытания стреляющего беспилотного летательного аппарата // BMPD Live Journal
[Электронный ресурс] - 26.03.2019 - URL: https://bmpd.livejournal.com/3583656.html
(дата обращения: 09.06.2019).
24
Отзывы:
Авторизуйтесь, чтобы оставить отзыв