САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ФАКУЛЬТЕТ ПРИКЛАДНОЙ МАТЕМАТИКИ – ПРОЦЕССОВ УПРАВЛЕНИЯ
Князькин Ярослав Вячеславович
Выпускная квалификационная работа аспиранта
Спектральные методы Н-оптимизации в задачах
обнаружения и оценивания динамических сбоев
в процессах управления подвижными объектами
Направление 09.06.01 "Информатика и вычислительная техника"
Научный руководитель:
доктор физ.-мат. наук,
профессор
Веремей Е. И.
Рецензент:
доктор технических наук,
профессор
Никульчев Е. В.
Санкт-Петербург
2018
ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ ........................................................................................................ 2
1. Актуальность проблемы, цели и основные результаты
исследований ....................................................................................... 4
2. Общая постановка и обсуждение рассматриваемых задач ............ 8
ГЛАВА 1. СПЕКТРАЛЬНЫЕ МЕТОДЫ H2 ОПТИМИЗАЦИИ ............ 14
1.1. Спектральный подход к H2-оптимизации, основанный на распределении управляющего воздействия по каналам ................ 15
1.2. Спектральный подход к H2-оптимизации систем с многомерным
управляющим сигналом при неединственности решения ........ 26
1.3. Структура многоцелевого закона управления
движением морских судов ........................................................... 33
ГЛАВА 2. СПЕКТРАЛЬНЫЙ СИНТЕЗ НАБЛЮДАТЕЛЕЙФИЛЬТРОВ ДЛЯ ОБНАРУЖЕНИЯ ДИНАМИЧЕСКИХ
СБОЕВ ............................................................................................ 36
2.1. Спектральный синтез H2-оптимального детектора динамических
сбоев для SISO систем .................................................................. 37
2.2. Синтез детектора динамических сбоев с применением спектрального подхода к MIMO H2-оптимизации............................. 44
2.3. Синтез H2-оптимального детектора динамических сбоев в многоцелевой структуре ...................................................................... 52
ГЛАВА 3. СПЕКТРАЛЬНЫЙ СИНТЕЗ НАБЛЮДАТЕЛЕЙФИЛЬТРОВ ДЛЯ ОЦЕНИВАНИЯ ВОЗДЕЙСТВИЯ ДИНАМИЧЕСКИХ СБОЕВ ................................................................................................ 56
3.1. Спектральный среднеквадратичный синтез наблюдателейфильтров для оценивания сбойного воздействия ..................... 57
2
3.2. Спектральный среднеквадратичный синтез оценивающих
наблюдателей-фильтров в многоцелевой структуре ................. 66
ЗАКЛЮЧЕНИЕ .............................................................................................. 73
ЛИТЕРАТУРА ............................................................................................... 74
3
ВВЕДЕНИЕ
1. Актуальность проблемы, цели
и основные результаты исследований
Сложность технических систем постоянно возрастает, что приводит
к увеличению вероятности различных отказов, которые могут вызвать
снижение качества процессов управления вплоть до потери устойчивости.
В связи с этим проблемы надежности и отказоустойчивости объектов
управления приобретают критическую важность. Быстрое обнаружение и
оценка воздействия, порожденного динамическим сбоем, необходимы для
своевременной перенастройки управления. Особо важную роль играет задача синтеза наблюдателей, оценивающих сбойное воздействие, поскольку
они является необходимым элементов всех методов активного противоаварийного управления (active fault tolerant control).
Данным задачам было уделено существенное внимание в ряде статей и монографий [1–20]. Тем не менее, на наш взгляд, в данной области
существуют недостаточно изученные аспекты.
Прежде всего, в подавляющем большинстве работ, посвященных задачам обнаружения динамических сбоев и оценки их воздействия на
управляемый объект не принимается во внимание частотный состав внешнего возмущения, хотя во многих случаях (прежде всего, в задачах управления морскими подвижными объектами) оно может быть описано как
случайный Гауссов процесс с заданной спектральной плотностью или в
более простой полигармонической форме. Учет этих особенностей при
синтезе законов управления и асимптотических наблюдателей может значительно повысить их эффективность.
В связи со всем перечисленным выше, существует необходимость
создания методов синтеза наблюдателей-фильтров для обнаружения воздействия динамических сбоев на управляемый объект и его оценки, учи4
тывающих частотные характеристики внешнего возмущения. Кроме того,
необходимо обеспечить возможность их перенастройки на борту объекта в
режиме реального времени.
Указанные обстоятельства определяют актуальность проведения
исследований, направленных на создание методов аналитического спектрального синтеза адаптивных наблюдателей для обнаружения динамических сбоев и оценки их воздействия на управляемый объект.
Целью работы является проведение исследований для развития математических методов решения задач обнаружения динамических сбоев и
оценки их воздействия с применением методов спектральной среднеквадратичной оптимизации.
Основное внимание в работе уделяется следующим направлениям
исследований:
развитие методов спектральной оптимизации, в том числе для объектов с многомерным управляющим воздействием, адаптированных для
синтеза наблюдателей-фильтров
исследование эффективности синтеза детекторов сбоев и оценивающих наблюдателей в многоцелевой структуре
обеспечение астатизма синтезированного наблюдателя-фильтра относительно внешнего возмущения
применение разработанных методов в практических задачах, для
подтверждения их эффективности
Диссертационная работа состоит из введения, трех глав, заключения
и списка использованной литературы.
Во введении формулируются задачи, рассматриваемые в проведенном исследовании, осуществляется описание и краткий анализ используемых математических методов, а также производится краткий обзор публикаций, посвященных рассматриваемым проблемам.
5
Первая глава диссертации посвящена спектральным методам H2
оптимизации, используемым в дальнейшем в данном исследовании. В первой части главы описывается решение задачи среднеквадратичного синтеза для систем с одним входом и одним выходом, что позволяет использовать очень простой алгоритм, основанный на факторизации полиномов.
Также представлен метод, который может быть применен к объектам с
многомерным управляющим сигналом. Он гарантирует не единственность
решения, что позволяет обеспечить дополнительные свойства замкнутой
системы, такие как астатизм. Кроме того, приводится описание многоцелевой структуры управления, которая позволяет легко задавать желаемый
спектр корней характеристического полинома.
Во второй главе осуществляется синтез H2 оптимального детектора
динамических сбоев с применением методов, предложенных в первой главе. Приведены два практических примера. В первом случае наблюдатель
формируется для объекта с одним входом и одним выходом и для его синтеза самый простой и наименее требовательный к вычислительным ресурсам подход. Второй вариант более сложный и требует решения уравнений
Риккати, но может быть применен к системам с несколькими измерениями. Продемонстрирован синтез детектора, обладающего свойством астатизма, в том числе в многоцелевой структуре.
Третья глава посвящена построению асимптотических наблюдателей, оценивающих воздействие динамических сбоев. Для решения поставленных в ней задач использованы те же методы, что и в предыдущей главе.
Основными результатами, которые получены на основе проведенных исследований и выносятся на защиту, являются следующие:
1. Усовершенствован спектральный подход к решению задач оптимизации по норме H2. Получены условия оптимальности управления, гарантирующие не единственность решения, что позволяет использовать
6
многоцелевую структуру управления и обеспечивать дополнительные
свойства замкнутой системы.
2. Предложены спектральные методы синтеза асимптотических
наблюдателей для обнаружения и оценки медленно меняющихся динамических сбоев.
3. Работоспособность и эффективность предложенных методов проверена на примере математической модели управления движением морского судна под действием волнения, а также ветра и морского течения.
Научная новизна и теоретическая значимость результатов квалификационной работы определяется созданием новых методов синтеза
наблюдателей для обнаружения и оценки воздействия аддитивных динамических сбоев при воздействии полигармонического возмущения с учетом возможности адаптивной перенастройки в режиме реального времени.
Практическая ценность работы состоит в возможности бортовой
реализации предложенных методов в режиме реального времени. Также
имеет значение то, что они могут быть применены в ситуации, когда воздействие внешнего возмущения сопоставимо с эффективностью органов
управления.
Работоспособность и эффективность предложенного подхода подтверждается конкретными примерами синтеза адаптивных наблюдателей
для морских подвижных объектов.
7
2. Общая постановка и обсуждение рассматриваемых задач
Задачи обнаружения и оценивания динамических сбоев сохраняют
свою актуальность в настоящее время. Несмотря на существование множества публикаций в этой области, подобным задачам при наличии известного спектрального состава внешнего возмущения, по нашему мнению, не
было уделено достаточного внимания. Внешнее воздействие, рассматриваемое в данной работе, может быть представлено как сумма нескольких
гармоник с известной центральной частотой (например, морское волнение) и, кроме того, допускается присутствие в нем постоянной составляющей (например, ветра или морского течения). Одним из наиболее распространённых примеров объектов управления, подверженных полигармоническому внешнему возмущению являются морские подвижные объекты, динамика которых рассматривается в практических примерах.
Для решения поставленных задач в данной работе применяются аналитические методы спектральной H 2 оптимизации, основанные на идеях,
предложенных в [21-29]. Подход, применяемый в них, основан на параметризации множества передаточных функций замкнутых систем и факторизации полиномов. В ряде ситуаций, решение задачи не единственно, что
позволяет обеспечивать дополнительные качества, такие как астатизм, и
использовать многоцелевую структуру регулятора. У спектральных методов оптимизации есть еще одно очень важное качество: они не требуют
сложных вычислений, таких как решение линейных матричных неравенств. Данное обстоятельство, несмотря на рост мощности вычислительных систем, играет существенную роль при реализации бортовых систем
автоматического управления в режиме реального времени, когда крайне
желательно, чтобы все вычисления укладывались в один такт. Наконец, в
некоторых случаях, при производстве беспилотных МПО может быть использована самая простая и дешевая элементная база, что приводит к
8
ограничению вычислительной мощности и оперативной памяти.
Заметим, что в работе рассматриваются такие системы, характеристики которых практически не зависят от текущего времени, в силу своих
технических особенностей и особенностей рассматриваемых условий
движения. Это позволяет рассматривать модели исследуемых объектов в
виде автономных систем нелинейных обыкновенных разностных уравнений. В практических задачах эти системы таковы, что допускают линеаризацию и дискретизацию. Таким образом, с учетом специфики задания моделей МПО, в качестве основной математической модели исследуемого
объекта рассматривается линейная стационарная система вида
x (t ) Ax(t ) Bu(t ) Hd(t ),
y(t ) Cx(t ),
(в.1)
где x E n – вектор состояния объекта, u E r – вектор управляющего
воздействия, d E l – вектор внешних возмущений, y E m – вектор измеряемых сигналов. A , B , H , E и C – постоянные матрицы соответствующих размерностей.
В рамках данного исследования предполагается что система (в.1) является полностью управляемой по вектору u и наблюдаемой по вектору
y , т.е. матрицы A , B , и C таковы, что имеют место равенства
rank(B, AB, A 2 B,..., A n 1 B) n , и rank(CT , ACT , A 2 CT ,..., A n 1CT ) n . В
силу выполнения этих равенств, возможно синтезировать стабилизирующее управление
~
u(s) W(s)y(s) W(s)x(s) .
(в.2)
Следует отметить, что управляющие органы морских судов имеют собственную динамику, которая могут моделироваться, например, наиболее
простыми линейными уравнениями:
δ u ,
(в.3)
где δ – состояние управляющих органов.
9
В большинстве рассмотренных в данном исследовании задач скалярное внешнее возмущение d d (t ) может быть описано как выходной
сигнал формирующего фильтра с передаточной функцией S1 ( s) , соответствующей спектральной плотности мощности
S d (s) возмущающего
воздействия:
S1 ( s) N ( s) T ( s) ,
S d ( s) S1 ( s) S1 ( s) ,
(в.4)
где полиномы N (s) и T (s) гурвицевы. Также может быть использовано
более простое полигармоническое представление:
d (t )
Nd
A
di sin( i t
i ) ,
(в.5)
i 1
где N d – число гармоник, а Adi , i , i их амплитуды, частоты и фазы соответственно. В этом случае предполагается, что известна его центральная
частота 0 . Функционал, характеризирующий качество управления
имеет следующий вид
1
I lim
T T
T
x' (t )Rx(t ) k u' (t )Qu(t )dt
2
x' Rx k 2 u' Qu ,
(в.6)
0
где R, Q – симметричные положительно определенные матрицы, k – положительная постоянная. Требуется найти регулятор W(s) , обеспечивающий минимальное значение функционала (в.6) и принадлежащий множеству W регуляторов, обеспечивающих гурвицевость характеристического полинома замкнутой системы, что может быть записано в виде
I I ( W) min .
(в.7)
WW
Функционал I может быть представлен в частотной области как
1
I
j
j
tr (F
T
2 T
x ( s )RFx ( s ) k Fu ( s )QFu ( s )) S d ( s ) ds ,
(в.8)
0
где Fx (s ) , Fu (s ) – передаточные функции от d к x и u соответственно:
10
Fx (s) (sI A BW) 1 H ,
1
Fu (s) W(sI A BW) H .
(в.8)
Далее вводится параметризация, предложенная в [21]: каждой паре
~
{Fx ( s) , Fu ( s)} однозначно соответствует матрица-параметр ( s) и подынтегральное выражение в (в.8) может быть представлено в виде
F0* F0 FxT (s)RFx (s) k 2 FuT (s)QFu (s)
~
~
(T1* *T2* )(T1 T2 ) T3 ,
(в.9)
где Ti (s) – передаточные матрицы, определяемые параметрами объекта
(в.1). В случае гармонического возмущения d с частотой 0 , интеграл
~
(в.8) принимает минимальное значения при любом ( s) , удовлетворяющем условию
~
0 ( j0 ) T21 ( j0 )T1 ( j0 ) ,
(в.10)
т.е. обращающим в нуль зависящее от него слагаемое. В таком случае задача (в.7) имеет бесконечно много решений, что позволяет добиться дополнительных качеств, таких как астатизм.
Отдельное внимание уделяется случаю SISO (Single Input and Single
Output) систем, поскольку для него может быть применен алгоритм, основанный только на факторизации полиномов без применения сложных вычислительных процедур, что делает его вычислительную сложность максимально низкой. К сожалению, он не предоставляет указанных выше
возможностей, что сужает область его применения. Представленные методы могут быть использованы для построения как базового закона управления, так и адаптивных наблюдателей, поскольку задача их синтеза является сопряженной для некоторой задачи оптимального управления.
Во второй главе внимание сосредоточено на решении задачи синтеза
наблюдателей для обнаружения динамических сбоев. Динамика объекта
задается линейной стационарной системой
11
x (t ) Ax(t ) Bδ(t ) Hd(t ) Ef (t ),
y(t ) Cx(t ),
(в.11)
где все переменные и параметры имеют то же значение что и в (в.1), а вектор f E
nf
– вектор воздействий, вызванных сбоем. Наблюдатель имеет
вид
xˆ Axˆ Bu ν ,
ν( s) L( s)(y Cxˆ ) ,
~
r C r (y Cxˆ ) ,
(в.12)
где x̂ E n – оценка состояния управляемого объекта, ν E n – корректирующий сигнал и r E1 – сигнал о произошедшем сбое или остаточный
сигнал (residual signal). Если значение r близко к нулю то система работает в нормальном режиме, в противном случае произошел сбой. Следует
отметить, что детектор (в.12) должен одновременно обладать максимальной чувствительностью к сбойным воздействиям и быть невосприимчивым к внешнему возмущению.
Для формализованной постановки задачи вводятся два функционала
J 1 J 1 (L( s)) min Frf ( s) 2 ,
1
J 2 J 2 (L( s)) max Frd ( s)
2
,
(в.13)
2
где Frf (s ) , Frd (s ) – это передаточные функции от f , d к r соответственно, а 1 , 2 – диапазоны частот, характерных для возмущений f и d . Задача состоит в поиске, передаточной матрицы L(s) , обеспечивающей одновременную минимизацию J1 и максимизацию J 2 . Во второй части второй главы рассматривается задача, где помимо подавления воздействия
полигармонического возмущения требуется обеспечить астатизм, т. е.
Frd (0) 0 .
Кроме того, приводится пример синтеза астатического детектора в многоцелевой форме.
12
Четвертая глава посвящена задаче оценки сбойных динамических
воздействий. Наблюдатель-фильтр имеет структуру
xˆ Axˆ Bu Efˆ ν ,
fˆ ν f ,
ν ( s) L( s)(y Cxˆ ) ,
ν f ( s) L f ( s)(y Cxˆ ) ,
(в.15)
где используются те же обозначения, что и в (в.12), а дополнительные координаты f̂ E
nf
– оценка сбойного воздействия. Качество наблюдателя
характеризуется временем оценки сбойного воздействия (напрямую связанным со степенью устойчивости) и воздействием внешнего возмущения
на асимптотический наблюдатель, которое характеризуется
значением
2
Fef d ( j0 ) 2 , где Fef d (s) – передаточная функция от d к ошибке оценивания сбойного воздействия e f f fˆ . В обоих рассмотренных примерах
приходится искать компромисс между качеством фильтрации и быстродействием, напрямую связанным со степенью устойчивости.
В последующих главах работы приводится более подробное описание соответствующих задач и методов их решения.
13
ГЛАВА 1. СПЕКТРАЛЬНЫЕ МЕТОДЫ H2 ОПТИМИЗАЦИИ
Главная специфическая особенность данного исследования заключается в том, что при синтезе законов управления и наблюдателей-фильтров,
предназначенных для обнаружения и оценки динамических сбоев необходимо учитывать влияние внешнего возмущения. В случае управления
движением морских судов, оно представлено морским волнением, течением и ветром, причем морское волнение представляется либо как случайный стационарный процесс, либо как сумма нескольких гармонических
колебаний.
В данной главе описываются спектральные методы H2 оптимизации,
применяемые в данном исследовании. В большинстве задач управления
подвижными объектами мощность управляющего воздействия ограничена,
и поэтому приходится добиваться компромисса между точностью стабилизации и интенсивностью управления, что определяет вид функционала
качества. Большинство широко известных методов оптимизации, используют линейные матричные неравенства (LMI-technique) и не учитывают
спектральные свойства внешнего возмущения, и поэтому в данной работе
используются специальные спектральные методы, основанные на полиномиальной факторизации и параметризации множества передаточных
функций замкнутой системы.
В данной главе представлены два алгоритма H2-оптимизации: первый из них, основан на распределении управляющего воздействия по каналам управления. Из-за своей простоты, он очень удобен для решения задач, касающихся SISO систем. Второй метод более сложен (содержит решение уравнений Риккати), но может быть применен к MIMO (Multiple Input – Multiple Output) объектам. Также он интересен тем, что позволяет
обеспечивать дополнительные свойства замкнутой системы, в том числе,
используя многоцелевую структуру управления.
14
1.1. Спектральный подход к H2-оптимизации, основанный на
распределении управляющего воздействия по каналам
Рассмотрим математическую модель LTI-объекта управления, представленную в пространстве состояний:
x Ax bu hd (t ),
y cx b y u,
(1.1)
где x E n – вектор состояния, u E 1 – скалярное управляющее воздействие, d E1 – скалярное возмущающее воздействие, y E1 – скалярная
регулируемая переменная, A, b, h, c – матрицы с постоянными компонентами, b y – постоянное число, пара A, c полностью наблюдаемая. При
этом будем считать, что вектор b, и число b y заранее не заданы.
В качестве возмущения d(t) будем рассматривать случайный стационарный процесс с нулевым математическим ожиданием, удовлетворяющий эргодической гипотезе и имеющий заданную спектральную плотность
мощности
–
четную
дробно-рациональную
функцию
S d (s) S d () js S1 (s)S1 (s) , S1 ( s) N ( s) / T ( s) , где N(s) и T(s) –
гурвицевы полиномы.
На движениях объекта (1.1) определим среднеквадратичный функционал
1
I lim
T T
T
y
2
(t ) k 2 u 2 (t )dt y 2 k 2 v 2 ,
(1.2)
0
где k – заданное вещественное число, v B(s)u ,
B(s) A(s)c(Es A) 1 b A(s)by , A(s) det(Is A) .
(1.3)
Будем считать, что управление u для объекта (1.1) формируется в виде:
u W ( s) y ,
(1.4)
где W – передаточная функция регулятора, W ( s) W1 ( s) W2 ( s) , причем
15
W1 ( s) и W2 ( s) – полиномы.
Введём в рассмотрение множество 0 дробно-рациональных функций произвольных степеней, а также множество * 0, определяемое
соотношением
* W 0 : Re i (W ) 0, 3 (i (W )) 0, i 1, n3 , где
(1.5)
3 ( s) A( s)W2 ( s) B( s)W1 ( s) , n3 deg 3 ( s ) .
(1.6)
Таким образом, множество * – это совокупность регуляторов вида
(1.4), обеспечивающих гурвицевость характеристического полинома 3 ( s)
замкнутой системы, имеющего степень n3.
Для замкнутой системы (1.1), (1.4) функционал (1.2) зависит от
выбора
β b T
передаточной
функции
W(1.s)
регулятора
и
вектора
by E n1 . При этом естественно поставить вопрос о поиске его
T
минимума при условии гурвицевости характеристического полинома замкнутой системы, что определяет задачу среднеквадратичного синтеза в
следующей постановке:
I I (W , β)
min
.
W* , βE n 1
(1.7)
Обратим внимание на то, что, в отличие от классической теории
среднеквадратичной оптимизации, задача (1.7) предполагает поиск не
только передаточной функции W (s) регулятора, но и вектора β эффективности управления, определяющего распределение его влияния на отдельные уравнения состояния.
Для решения задачи (1.7), прежде всего, преобразуем математическую модель (1.1) объекта управления, сводя ее к уравнению «входвыход»
A(s) y B(s)u L(s)d .
(1.8)
Здесь, в дополнение к обозначениям (1.3), введен полином
L(s) A(s)c(Is A) 1 h .
(1.9)
16
Подчеркнем, что свобода в распределении управлений для объекта
(1.8) определяется тем, что полином B(s) , для которого справедливо условие
m deg B(s) n ,
(1.10)
априорно не фиксирован. При этом в соответствии с (1.3) значения функционала (1.2) однозначно определяются выбором этого полинома и передаточной функции регулятора (1.4). Тогда задача (1.7) преобразуется к виду
I I (W , B)
min
W * , B ( p )b
,
(1.11)
где b – совокупность полиномов B(s) , удовлетворяющих (1.10).
Теперь будем рассматривать задачу (1.11) для замкнутой системы
(1.8), (1.4) с функционалом (1.2), что эквивалентно исходной постановке.
Далее будем использовать следующие специальные обозначения для
решения задачи (1.11):
W0 , B0 arg
min
W * , B ( p )b
I (W , B), I 0 I (W0 , B0 ),
W0 ( s) W01 ( s) W02 ( s) .
(1.12)
Дополнительно введем в рассмотрение вспомогательную замкнутую
систему управления, в состав которой входит объект с математической
моделью
A(s) y v L(s)d ,
(1.13)
v V ( s) y ,
(1.14)
а также регулятор
где v E1 – новое скалярное управляющее воздействие. Все прочие переменные и параметры системы (1.13), (1.14) такие же, как и в системе (1.8),
(1.4). Будем рассматривать функционал (1.2) и на движениях замкнутой
системы (1.13), (1.14). Заметим, что в данном случае его значения определяются только выбором передаточной функции V ( p) регулятора (1.14).
17
Это позволяет поставить следующую задачу оптимального среднеквадратичного синтеза:
I I (V ) min* ,
(1.15)
V
для решения которой будем использовать обозначения
V0 arg min* I (V ), I 0v I (V0 ) , V0 ( s) V01 ( s) V02 ( s) .
V
(1.16)
По отношению к задачам (1.11) и (1.15) справедливо следующее базовое утверждение.
Теорема 1. Задача (1.11) о достижении минимума функционала
(1.2) на движениях замкнутой системы (1.8),(1.4) со свободным распределением управления эквивалентна задаче (1.15) о достижении минимума
этого же функционала на движениях замкнутой системы (1.13),(1.14), в
том смысле, что
V0 ( s) B0 ( s)W0 ( s) , I 0v I 0 .
(1.17)
Доказательство. Предположим, что каким-либо путем найдено решение (1.12) задачи (1.11). Этому решению соответствует гурвицев характеристический полином
0 ( s) A( p)W02 ( s) B0 ( s)W01 ( s)
(1.18)
замкнутой системы (1.8),(1.4), а также минимальное значение
I0
W
02 (
j) k B0 ( j)W01 ( j)
2
2
0
2
2
L( j)
S d ()d
0 ( j)
(1.19)
функционала (1.2).
Теперь сформируем регулятор
v V * ( s) y ,
(1.20)
где V * (s) B0 (s)W0 (s) , и замкнем этим регулятором объект (1.13). Характеристический полином замкнутой системы (1.13),(1.20) с очевидностью
совпадает с (1.18), откуда следует, что V * (s) * . При этом легко видеть,
что
регулятор (1.20) для объекта (1.13) обеспечивает значение (1.19)
18
функционала (1.2). Следовательно, имеет место равенство I * I (V * ) I 0 .
Покажем, что при этом справедливо равенство I * I 0v , используя доказательство от противного.
~
Действительно, предположим, что найдется регулятор v V (s) y
~ ~ ~
~
~
~
(V V1 V2 ) для объекта (1.13) такой, что V (s) * и I I (V ) I * I 0 .
~
~
~
При этом выполним представление V1 (s) B (s)V1 (s) , где полином B удо~
влетворяет условию deg B (s) n и сформируем регулятор
~
~
~
(1.21)
u W ( s) y , W (s) V1 (s) V2 (s) .
~ ~
Но тогда для замкнутой системы (1.8),(1.21) имеем I (W , B ) I , т.е.
~ ~
пара W , B дает лучший результат, чем пара W0 , B0 , что невозможно.
Отсюда следует, что I * I 0v I 0 , V * ( s) V0 ( s) .
Таким образом, решение (1.12) задачи (1.11) однозначно определяет
и решение задачи (1.15).
Наоборот, предположим, что найдено решение (1.16) задачи (1.15).
Тогда выполним любым способом представление
V01 ( s) B ( s)V01 ( s)
(1.22)
числителя передаточной функции V0 ( s ) так, чтобы deg B ( p) n , и сформируем регулятор
u W ( s) y , W ( s) V01 ( s) V02 ( s) .
(1.23)
Аналогично предшествующей ситуации нетрудно показать, что пара
W , B будет оптимальной в задаче (1.11), обеспечивая минимальное значение I 0 I 0v функционала (1.2) для замкнутой системы (1.8),(1.23).
Таким образом, теорема доказана полностью. ■
Замечание. Поскольку представление (1.22) в общем случае выполняется не единственным образом, очевидно, что задача (1.11) может иметь
не единственное решение.
19
Как следует из теоремы 1, задача синтеза (1.11) с распределением
управлений сводится к эквивалентной задаче (1.15), относящейся к стандартному кругу вопросов теории среднеквадратичной оптимизации.
В рамках современных подходов задачу (1.15) можно трактовать как
частный вариант H 2 -оптимального синтеза и решать с помощью широко
используемых методов типа «2-Риккати» процедуры или использовать
технику LMI. Однако на этом пути имеются существенные трудности, связанные с вырожденностью задачи (1.15) в контексте H -теории.
Как показано в статье [23], преодоление указанных трудностей естественным образом реализуется в рамках специализированного спектрального подхода, детально представленного в работах [21, 26].
В соответствии с этим подходом, решение задачи (1.15), как частного варианта задач среднеквадратичного синтеза, определяется передаточной функцией
V0 (s)
A(s)T (s) R(s) L1 (s) N (s) / G(s)
T (s) R(s) k 2 A(s) L1 (s) N (s)/ G(s)
(1.24)
оптимального регулятора (1.14). Здесь G(s) и L1 ( s ) – гурвицевы полиномы, являющиеся результатами факторизаций
k 2 A(s) A(s) 1 G(s)G(s) , L( s) L( s) L( s)1 L1 ( s) ,
(1.25)
R(s) – вспомогательный полином, определяемый формулой
R( s )
G(s) S1 ( g i ) L1 ( g i )
,
g
s
A
(
g
)
G
(
g
)
i 1
i
i
i
n
(1.26)
где G( g i ) dG(s) / ds |s gi , g i ( i 1, n ) – корни полинома G(– s) (предполагается, что все они являются простыми). Деление на полином G(s) в
формуле (1.24) осуществляется нацело (без остатка).
Приведенное спектральное представление (1.24) решения задачи
среднеквадратичного синтеза позволяет сформулировать утверждения.
20
Теорема 2. Передаточная функция V0 ( s ) (1.16) оптимального регулятора (1.14), являющегося решением задачи (1.15), может быть всегда
представлена в виде
V0 ( s) B0 ( s)W0 ( s) ,
(1.27)
где B0 ( s) – полином степени n , а W0 ( s) W01 ( s) W02 ( s) – правильная рациональная дробь, т.е.
deg B0 ( s) n , degW01 ( s) degW02 ( s) .
(1.28)
Доказательство. Представим передаточную функцию (1.24) в виде
1
V01 (s) s 1s 1s 0
V0 (s)
V02 (s) v s v v1s v1 1s 0
(1.29)
и, вводя обозначения, p deg N (s) , q degT (s) , k deg L(s) найдем степени полиномов
V01 ( s)
и
V02 ( s ) . Учитывая, что
degG(s) n
и
deg R(s) n 1 , из (1.24) получим
maxn q n 1, p k n , maxn q 1, p n k n .
Поскольку имеют место соотношения p q и k n , отсюда следует
n q 1, maxq 1, p k.
(1.30)
Замечание: из (1.24) видно, что снижение степени полинома V01 ( s)
по сравнению с (1.30) невозможно, а для полинома V02 ( s ) это возможно
лишь при условии p k q 1 , однако такая ситуация является сугубо
частной для конкретного значения : далее будем считать, что она не
имеет места.
На основании (1.30) можно утверждать, что числитель V01 в (1.29)
всегда можно представить в виде произведения двух полиномов:
V01 ( s) B0 ( s)W01 ( s) , deg B0 ( s) n , degW01 ( s) q 1 .
(1.31)
При этом для степени полинома V02 в знаменателе справедливо
degV02 ( s) q 1 либо degV02 ( s) p k q 1 .
21
Таким образом, принимая W0 ( s) W01 ( s) W02 ( s) , где W02 ( s) V02 ( s) , приходим к утверждению теоремы. ■
Теорема 2 по существу определяет метод решения исходной задачи
(1.7) для объекта (1.1) с обратной связью (1.4).
Теорема 3. Пусть найдена передаточная функция V0 ( s ) (1.16),
определяющая решение задачи (1.15), для которой имеет место представление (1.27), указанное в теореме 2. Тогда решение
W * , β* arg Wmin
, βE
*
n 1
I (W , β)
(1.32)
задачи (1.7) определится передаточной функцией W * ( s) W0 ( s) , а также
вектором β
*
b
*T
b*y
, где b
T
*
– решение линейной системы
Csb b s 0 b*ya s .
(1.33)
Здесь матрица
c1( n1)
c1( n2)
Cs
c11
c10
c2( n1)
c2 ( n 2 )
c21
c20
cn( n1)
cn ( n 2 )
cn1
cn 0
состоит из коэффициентов полиномов
Ci (s) ci ( n1) s n1 ci ( n2) s n2 ci1s ci 0 , i 1, n ;
вектор b s 0 b0( n1) b0( n2) b01 b00 T включает коэффициенты полинома
B0 (s) b0n s n b0(n1) s n1 b0( n2) s n2 b01s b00 ,
a s an1 an2 a1 a0 T
–
а
коэффициенты
вектор
полинома
A(s) s n an1s n1 an2 s n2 a1s a0 ; и, наконец, b*y b0n .
Доказательство. В соответствии с теоремами 1 и 2, регулятор (1.4) с
передаточной функцией W W0 совместно с полиномом B0 ( s ) определяют
22
решение задачи (1.11) для объекта (1.8). Однако, как было отмечено выше,
она эквивалентна задаче (1.7) в том смысле, что решением задачи (1.7)
служит
β b T
указанный
регулятор
(1.3)
совместно
с
вектором
by E n1 , который удовлетворяет тождеству
T
A(s)c(Is A) 1 b A(s)by B0 (s) .
(1.34)
Вводя обозначение
C(s) A(s)c(Is A) 1 C1 (s) C2 (s) Cn (s) ,
перепишем тождество (1.34) в виде
C1 (s) C2 (s) Cn (s) b B0 (s) A(s)by .
Приравнивания коэффициенты при одинаковых степенях переменной s в последнем соотношении, получим равенство by b*y b0n и систему линейных уравнений (1.33) относительно неизвестных компонентов
вектора b . Заметим, что условие полной наблюдаемости пары A, c гарантирует взаимную простоту полиномов Ci (s), i 1, n , что, в свою очередь, гарантирует невырожденность матрицы C s , т.е. существование
единственного решения b b* системы (1.33). ■
Спектральный подход к среднеквадратичному синтезу, применение
которого обосновано доказанными выше теоремами, позволяет построить
вычислительную схему решения задачи синтеза с распределением управлений.
В качестве исходных данных будем принимать матрицы A , h , c математической модели объекта управления (1.1), значение весового множителя в функционале (1.2), а также полиномы N (s) и T (s) в спектральной
плотности мощности возмущения.
Для нахождения оптимального решения задачи (1.7) необходимо
выполнить следующие действия:
23
1.
Найти
A(s) det(Is A) ,
полиномы
L(s) A(s)c(Is A) 1 h ,
Ci (s), i 1, n , где C1 (s) C2 (s) Cn (s) A(s)c(Es A) 1 .
2. Выполнить факторизации
k 2 A(s) A(s) 1 G(s)G(s) , L( s) L( s) L( s)1 L1 ( s) ,
(1.35)
т.е. построить гурвицевы полиномы G(s) и L1 ( s ) .
3. Сформировать вспомогательный полином
R( s )
n
N ( g i ) L1 ( g i )
G( s)
,
s
A
(
g
)
T
(
g
)
G
(
g
)
i
i
i
i
g
i 1
(1.36)
где G( g i ) dG(s) / ds |s gi , g i ( i 1, n ) – корни полинома G(– s) (считаем, что все они простые).
4. Построить вспомогательную передаточную функцию
V0 ( s) V01 ( s) V02 ( s) ,
V01 ( s) A( s)T ( s) R( s) L1 ( s) N ( s) / G ( s) ,
(1.37)
V02 (s) T (s) R(s) k 2 A(s) L1 (s) N (s)/ G(s) ,
выполняя деление на полином G(s) нацело.
5. Взять любые n корней i полинома V01 ( s ) , а также все его оставшиеся корни j ( j 1, n) и сформировать полиномы
B0 ( s)
n
s , W
i
i 1
01 ( s )
n
s
j
.
(1.38)
j 1
6. Сформировать вектор b s 0 b0( n1) b0( n2) b01 b00 T коэффициентов полинома B0 ( s ) и вектор a s an1 an2 a1 a0 коэффициентов
T
полинома A(s) ; построить матрицу
24
c1( n1)
c1( n2)
Cs
c11
c10
c2( n1)
c2 ( n 2 )
c21
c20
cn( n1)
cn ( n 2 )
cn1
cn 0
из коэффициентов полиномов Ci (s), i 1, n .
7. Найти решение b b * линейной системы алгебраических уравнений
Cs b b s0 a s .
(1.39)
8. В качестве передаточной функции оптимального регулятора (1.3)
принять W0 ( s) W01 ( s) W02 ( s) , где W02 ( s) V02 ( s) . В качестве оптимального вектора b принять b b * , а в качестве оптимального числа bu –
bu bu* 1.
25
1.2. Спектральный подход к H2-оптимизации систем с многомерным
управляющим сигналом при неединственности решения
В данном разделе предлагается подход, применимый к задачам с полигармоническим внешним возмущением, который несколько сложнее,
чем описанный выше, но имеет существенно более широкие возможности.
Рассмотрим линейную стационарную систему
x Ax Bu Hd (t ) ,
y Cx,
(1.40)
где x E n – вектор состояния системы, u E r – вектор управляющего
воздействия, d – внешнее возмущение (далее предполагающееся скалярным), y E m – вектор измеряемых переменных. Будем считать, что рассматриваемая система управляема и наблюдаема.
Внешнее возмущение d рассматривается в виде
d (t )
Nd
A
di
sin( i t i ) ,
i 1
где N d – количество гармонических функций, Adi , i , i – их амплитуды,
частоты и фазы соответственно. Предположим, что 0 – центральная
частота d .
Будем оценивать качество управления с помощь среднеквадратичного функционала
T
1
J (W ) lim
(xT Rx k 2uT Qu) dt ,
T T
0
(1.41)
где R , Q – положительно определенные матрицы с постоянными коэффициентами, k – положительная постоянная. Закон управления формируется в виде
~
u W(s) y W(s)x W21 (s)W1 (s)x ,
(1.42)
где W1 ( s) , W2 ( s) – ( r n ) и ( r r ) полиномиальные матрицы, и его поиск
26
осуществляется на множестве W регуляторов, обеспечивающих гурвицевость характеристического полинома замкнутой системы
(s) ( As (s))1r det(W1B s W2 (s) As (s)) , где
(1.43)
B(s) As (s)( sI A) 1 B , As det(A) .
Требуется построить стабилизирующий регулятор W(s) W , обеспечивающий минимальное значение функционала (1.41)
J (W) min .
WW
(1.44)
Как было отмечено [21, 26], зависимость функционала J от передаточной матрицы W(s) имеет сложный нелинейный характер, поэтому рассмотрим передаточные функции Fx (s ) , Fu (s )
Fx ( s) (sI A BW) 1 H ,
Fu (s) W(sI A BW) 1 H ,
(1.45)
от d к векторам состояния и управления x и u соответственно и запишем
функционал J в частотной области:
1
J
j
j
tr F
T
x
(s)RFx ( s) k 2 FuT (s)QFu ( s)S d ( s)ds ,
(1.46)
0
получая квадратичную зависимость от Fx (s ) , Fu (s ) . Воспользуемся параметризационнным подходом, предложенным в [21], и введем передаточную матричную функцию (s)
( s) ( s)Fx ( s) ( s)Fu ( s) ,
(1.47)
где (s) , (s) – некоторые полиномиальные матрицы размерности –
( r n ) и ( r r ) соответственно. Их выбор может быть осуществлен аналогично [21], в виде
( s ) 0
1 1 T
Q B S , (s) 0 I ,
k2
(1.48)
где матрица S – решение матричного уравнения Риккати
27
SA AT S
1
SBQ 1BT S R 0 .
2
k
(1.49)
Такой выбор параметров (s) , (s) обеспечивает гурвицевость полинома
B
Is A
,
1
det
2 Q 1BT S I
k
и упрощает многие вычисления.
Запишем уравнения, описывающие динамику замкнутой системы в
частотной области
sI A x Bu Hd ,
W1 ( s)x W2 ( s)u 0 ,
и перепишем их с учетом обозначений (1.47) и (1.48):
Fx
P
1 H
M , M
Fu
0
B
,
0
(1.50)
где P sI A . Используем формулу обращения Фробениуса обращения
блочной матрицы, учитывая равенство
((s) (s)P 1B) 1 As (s)( As (s)(s)
1
1
(s)B s (s)) As (s) ,
(1.51)
и получим ее значение
P 1 B s ( s) 1 ( s)( s)P 1 B s ( s) 1 ( s)
M 1
.
1
1
1
A
(
s
)
(
s
)
(
s
)
P
A
(
s
)
(
s
)
s
s
(1.52)
Подставляя его в формулу (1.50), получим выражение передаточных матриц замкнутой системы через параметр (s) :
~
~
Fx Fx () H s ( s) / As ( s) B s ( s) 1 ( s) ( s) ,
~
~
Fu Fu () As ( s) 1 ( s) ( s) ,
(1.53)
~
где 0 P 1H .
Теперь выразим подынтегральное выражение в (1.46)
F0* (s) F0 (s) FxT (s)RFx (s) k 2 FuT (s)QFu (s) ,
(1.54)
28
~
как функцию ( s) . Отметим, что при выборе параметров (s) , (s) согласно формулам (1.48), выполняется равенство, доказанное в [21]:
*1 (B*s RB s k 2QAs* As )1 k 2Q ,
(1.55)
что существенно упрощает дальнейшие вычисления. Выражение (1.54)
может быть записано в виде
~
~
F0* F0 (T1* *T2* )(T1 T2 ) T3 , где
T1 ( s) (k Q ) 1 *1B*s RH s / As ( s), T2 ( s) k Q ,
(1.56)
T3 ( s) (H *s RH s ) / As ( s) As (s) T1* ( s)T1 ( s) .
~
Видно, что T3 ( s ) не зависит от параметра ( s) и функционал J 2 принимает минимальное значение тогда и только тогда, когда выражение
j
1
~
~
tr [(T1* *T2* )(T1 T2 )]S d ( s)ds ,
j 0
достигает своего минимума. В соответствии с фильтрующим свойством
дельта-функции, выполняется равенство
j
1
~
~
tr [(T1* ( s) ( s)* T2* ( s))(T1 ( s) T2 ( s)( s))] S d ( s)ds
j 0
(1.57)
1
~
~
tr [(T1* *T2* )(T1 T2 )] s j0 .
j
~
Из равенства (1.57) следует, что J 2 зависит от матрицы ( j0 ) и может
~
~
быть минимизирован за счет выбора такого ( j0 ) 0 ( j0 ) , что выражение (1.57) обращается в нуль:
~
T1 ( j0 ) T2 ( j0 ) 0 ( j0 ) 0 , или
~
0 ( j0 ) T21 ( j0 )T1 ( j0 )
(k 2 Q) 1 *1B *s RH s / As ( s) s j0 .
(1.58)
Динамика оптимальной замкнутой системы на частоте 0 может быть получена подстановкой (1.58) в выражения (1.53):
29
Fx ( j0 ) H s ( j0 ) / As ( j0 )
~
B s ( j0 ) 1 ( j0 ) 0 ( j0 ) ,
~
Fu ( j0 ) As ( j0 ) 1 ( j0 ) 0 ( j0 ) .
(1.59)
Отметим, что полученные значения (1.59) только описывают динамику оптимальной замкнутой системы на частоте 0 , но не дают решения поставленной задачи минимизации функционала (1.41). Докажем условие оптимальности регулятора W(s) , доказав следующую теорему.
Теорема 4. Решение задачи (1.44), является не единственным, причем передаточная функция W(s) , стабилизирующая управляемый объект
и удовлетворяющая условию
W( j0 )Fx ( j0 ) Fu ( j0 ) ,
(1.60)
обеспечивает минимальное значение функционала (1.41).
Доказательство. Идея доказательства теоремы аналогична используемой в [24]. Необходимость условия c очевидностью вытекает из (1.42).
Докажем достаточность, опуская для краткости аргумент j0 . Пусть
найден любой регулятор W(s) , удовлетворяющий (1.60). Сначала запишем очевидное равенство:
~
~
Fx (sI A) 1 BFu (sI A) 1 H ,
(1.61)
перепишем его как
~
~
(sI A)Fx BFu H ,
и, подставляя (1.60) в (1.61) получим
~
(sI A BW)Fx H ,
Теперь рассмотрим уравнения замкнутой системы. Её передаточные матрицы имеют вид
Fˆ x (sI A BW) 1 H ,
Fˆ u W(sI A BW) 1 H ,
(1.62)
и, согласно (1.62), при s j0 имеем
30
~ ~
Fˆ x ( j0 I A BW) 1 ( j0 I A BW)Fx Fx ,
~
Fˆ u Fu .
Теорема доказана. ■
Наконец, рассмотрим два варианта вычисления передаточной матрицы W(s) . Первый с использованием модального синтеза, задавая желаемый характеристический полином замкнутой системы.
К сожалению,
модальный синтез не может быть осуществлен непосредственно, потому
что зависимость полинома (1.43) от координат передаточной матрицы
W(s) носит нелинейный характер в случае многомерного управляющего
сигнала. Один из способов преодолеть эту сложность – поочередно искать
строки передаточной матрицы W(s)
w k (s) w1k (s) / w2k (s) , k 1, , r ,
(1.63)
где w 1k ( s ) , w2 k ( s ) – полиномиальные строки и полиномы соответственно,
строя r замкнутых систем следующим образом.
Отметим, что функции w k (s ) могут быть построены в любом порядке, но для простоты предположим, что они вычисляются по порядку от 1
до r .
Введем
обозначения
B s ( s) b1s ( s) b 2 s ( s) b rs ( s) ,
0 ( s) As ( s) , b0js b js (s) , j 1, r , H 0s H s , зададим k 1 и перепишем
(1.63) как
r
b
ui ( s) H ks 1 ( s)d ( s) .
(1.64)
u k ( s) w k ( s)x( s) , w k ( s) w1k ( s) / w2 k ( s) ,
(1.65)
k 1 (s)w2k (s) w1k (s)bkks1 (s) k (s) ,
(1.66)
w1k ( j0 )Fx ( j0 ) Fuk ( j0 )( j0 ) w2k ( j0 ) ,
(1.67)
k 1 ( s)x( s)
k 1
is ( s )
i k
На k-м шаге мы строим обратную связь
решая уравнения
31
где k (s) – задаваемый на k-м шаге полином, Fuk ( j0 ) – k-я строка
Fu ( j0 ) , принимая во внимание дополнительные условия, если они есть
(такая ситуация возникнет в Главе 3) и то, что полином k 1 ( s) и координаты b isk 1 (s) могут иметь общие корни, которые должны быть корнями
полинома k (s) . Затем мы подставляем построенную обратную связь в
выражение (1.64) и получим выражение
(I k 1 ( s) b kks1w k )x( s)
m
b
k 1
is ( s )
ui ( s) H ks 1 ( s)d ( s) ,
(1.68)
i k 1
которое может быть переписано как
k ( s ) x( s )
m
b
k
is ( s )
ui ( s) H ks ( s)d ( s) , где
i k 1
b isk ( s) k ( s)(I k 1 ( s) b kks1 ( s)w k ( s)) 1 b isk 1 ( s) ,
(1.69)
H ks ( s) k ( s)(I k 1 ( s) b kks1 ( s)w k ( s)) 1 H ks 1 ( s) .
После этого номер k увеличивается на единицу и вычисления (1.64)-(1.69)
повторяются. После r-го повторения мы получим оптимальный регулятор
W( s) w1T ( s)
w T2 ( s)
w Tr ( s)
T .
32
1.3. Синтез H 2 оптимального регулятора в многоцелевой структуре
Несложно заметить, что описанный выше способ построения передаточной матрицы оптимального регулятора выглядит достаточно сложным, особенно в случае, когда размерность вектора управлений достаточно велика. Опишем более простой способ обеспечить желаемое распределение корней характеристического полинома замкнутой системы.
С этой целью обратимся к понятию многоцелевой структуры обратной связи, представленной в работе [26]. Эта структура включает в себя
три элемента: базовый стабилизирующий закон управления u Kx ,
асимптотический наблюдатель и динамический корректор:
z Az Bu L(y Cz ),
u Kz ,
F( s)(y Cz ).
(1.70)
Здесь z E n – вектор состояния наблюдателя, E r – выход динамического корректора, передаточная функция которого F(s) имеет элементы
Fij ( s)
N ijc ( s)
F ( s)
с гурвицевым знаменателем F (s ) . Предполагается, что по-
стоянные матрицы K и L известны и требуется найти передаточную матрицу F(s) , обеспечивающую оптимальность регулятора (1.70).
Вначале рассмотрим характеристический полином замкнутой системы (1.40), (1.70). Представим корректор F(s) в пространстве состояний,
для простоты предполагая, что все его элементы Fij (s) – строго правильные дроби:
p p ( y Сz),
p ,
где , , – постоянные матрицы, такие что
(Is ) 1 F(s) .
33
Теперь рассмотрим уравнения системы (1.40), замкнутой регулятором (1.70), которые принимают вид
x Ax BKz Bp Hd (t ) ,
z LCx ( A LC BK )z Bp ,
p Cx Cz p ,
и запишем ее характеристический полином
Is A
BK
B
(s) LC Is A LC BK B ,
C
C
Is
Если прибавить к первому столбцу второй, и затем вычесть из второй
строки первую, то мы получим, что
Is A BK
BK
B
( s )
0
Is A LC
0 0 ( s) L ( s ) F ( s ) ,
0
C
Is
где 0 det(A BK ) , L det(A LC) и F (s) det . Таким образом,
варьируемые корни (s) совпадают с корнями F (s) .
Теперь покажем связь между корректором и передаточной матрицей
регулятора. Для этого сначала запишем уравнения (1.70) в частотной области в виде уравнения «вход-выход»
u T11 ( s)y T12 ( s) ,
T21 ( s)y T22 ( s) ,
F( s) , y Cz ,
(1.71)
где блоки Tij (s) передаточной матрицы T(s) определяются как
K
0
1
T( s)
Is A LC BK L B
C
Im
Ir
.
0
(1.72)
Рассмотрим систему (1,71) как объект управления, а корректор – как регулятор и, выразим из (1.72) y , исключая вспомогательные переменные
, . В результате получим передаточную матрицу от y к u
~
W(s) T11(s) T12 (s)F(s)I T22 (s)F(s)1 T21(s) ,
(1.73)
34
и выразим из (1.73) F(s)
1
~
1
F( s) I T121 ( s)W( s) T11 ( s)T21
( s)T22 ( s)
~
1
T121 ( s)W( s) T11 ( s)T21
( s) .
(1.74)
Теперь покажем, как построить регулятор (1.70), удовлетворяющий условию (1.60). Сначала найдем комплекснозначную матрицу 0 , удовлетворяющую равенству
0 CFx ( j0 ) Fu ( j0 ) ,
после чего найдем необходимое F( j0 ) по формуле
1
1
F( j0 ) I T1210 T11T21
T22 T1210 T11T21
1
s j0
,
Предварительно задав полином F (s) с желаемой степенью устойчивости,
вычислим числители элементов корректора, обеспечивающие выполнение
равенства
Nijc ( j0 ) Fij ( j0 ) F ( j0 ) .
Наконец, следует отметить, что настройка корректора может осуществляться не только для оной частоты 0 , но и для нескольких частот.
Ниже, в Главе 2 будет рассмотрена задача по обеспечению желаемого поведения системы как на центральной, так и на нулевой частоте.
35
ГЛАВА 2. СПЕКТРАЛЬНЫЙ СИНТЕЗ НАБЛЮДАТЕЛЕЙФИЛЬТРОВ ДЛЯ ОБНАРУЖЕНИЯ ДИНАМИЧЕСКИХ СБОЕВ
В настоящее время существует достаточно много методов обнаружения динамических сбоев, в том числе использующих асимптотические
наблюдатели. Подробная библиография работ в данном направлении присутствует, например, в монографии [1].
Несмотря на разнообразие математических методов обнаружения
динамических сбоев, в большинстве из них присутствует общая идея: сигнал, измеряемый сенсорами управляемого объекта, сравнивается с «эталонным» сигналом, полученным тем или иным методом, например с помощью статистического анализа ранее полученных данных об объекте,
нейронной сети или, как в данном исследовании, модели управляемого
объекта. Разница между оценкой, полученной с их помощью, и измерением называется остаточным сигналом (residual signal) и определяет, функционирует объект в нормальном режиме (если этот сигнал близок к нулю)
или же произошел сбой.
В данной главе предлагаются два метода спектрального синтеза детекторов динамических сбоев для систем, подверженных воздействию полигармонических колебаний. Первый из них максимально простой и может быть использован для систем со скалярным измеряемым сигналом.
Второй вариант содержит сложные вычисления –
решение уравнений
Риккати – но может быть применен для систем с многомерным выходом, а
также дает достаточную свободу в выборе структуры наблюдателя, что
позволяет обеспечивать желаемые свойства в дополнение к H2 оптимальности. Наконец, демонстрируется синтез детектора динамических сбоев в
многоцелевой структуре.
36
2.1. Спектральный синтез H2-оптимального
детектора динамических сбоев для SISO систем
Представим объект управления, заданный линейной стационарной
моделью в пространстве состояний
x Ax bu pd (t ) Ef (t ),
y cx,
(2.1)
где x E n – вектор состояния объекта, y, u , d и f – скалярные величины: y – измеряемая координата, u – управляющее воздействие, d – внешнее возмущение, f – сбойное воздействие. Предполагается, что сигнал f
является медленно меняющимся, т.е. f 0 .
Наблюдатель, предназначенный для обнаружения сбойного воздействия, имеет следующий вид:
xˆ Axˆ bu L ,
s W s y cxˆ ,
r e y y cxˆ ,
(2.2)
Будем считать, что внешнее возмущение представляется стационарным
эргодическим случайным процессом d (t ) , имеющим заданную спектральную плотность S d s мощности:
S d s S1 s S1 s ,
S1 s
Nd s
4 Dr
1
,
2
T s
s 2s s 2
(2.3)
где – центральная частота, st , st – степень «размытости» спектра
по частотам. Отметим, что при синтезе постоянный множитель
4 Dr /
не играет роли и может быть опущен. Также возможно использовать более
простое полигармоническое описание этого возмущения в виде
d t
nh
A sin t ,
di
i
i
i 1
37
где Adi , i , i – амплитуда, частота и фаза соответствующих гармоник.
Сигнал r (t ) должен быть максимально чувствителен к постоянному
воздействию, порождающему сбой, и, в то же время, он не должен реагировать на внешнее возмущение d .
Для формализованной постановки задачи будем использовать идею,
сходную с методом H / H оптимизации, описанным в [1]. Функционал,
характеризующий качество работы наблюдателя–фильтра (2.2), имеет
вид
J J (L,W ( s)) J1 / J 2 ,
J1 min Frf ( j) , J 2 max Frd ( j) ,
1
(2.4)
2
где Frf (s) , Frd (s) – это передаточные функции от f , d к r соответственно, а 1 , 2 – диапазоны частот, характерных для возмущений f и d .
Задача состоит в поиске элементов W s и L , обеспечивающих максимум
функционала J :
Запишем
систему
в
отклонениях
относительно
переменных
e x x xˆ , e y y cxˆ :
e x Ae x L Pd Ef ,
s W s e y .
(2.5)
и рассмотрим ее в изображениях по Лапласу:
A s e y s L s P s d s E s f s , где
(2.6)
A s det Is A , E s A s c Is A 1 E,
P s A s c Is A 1 P, L s A s c Is A 1 L,
соответственно, Frf (s) , Frd (s) могут быть выражены как
Frf ( s)
W ( s) E s
W2 (s) P s
d s ,
d s , Frf ( s) 2
( s )
( s )
(2.7)
где (s) - характеристический полином замкнутой системы
( s) A s W2 ( s) L( s)W1 ( s) .
38
Отметить, что динамика замкнутой системы (2.5), (2.7) зависит от
вектора L и передаточной функции W s . Один из вариантов решения
данной задачи – искать их последовательно, но это увеличивает объем вычислений, поэтому в данной статье предложен алгоритм их одновременного поиска, (подробно описанный в [31], где был применен для решения
подобной задачи). Если произвести в (2.6) замену переменной s на
~
s V ( s)e s , где
y
V ( s) V1 ( s) / V2 ( s) , V1 ( s) L( s)W1 ( s) , V2 ( s) W2 ( s) ,
то (2.6) принимает вид
A s e y s ~
s P s d s E s f s .
(2.8)
Из уравнения (2.4) видно, что динамика замкнутой системы полностью
определяется передаточной функцией V (s) , поиск которой может быть
осуществлен посредством минимизации функционала
1
~ ~
J J V lim
T T
T
e
2
y
k 2~
2 dt min .
V
(2.9)
0
Здесь коэффициент k характеризует интенсивность подавления внешнего
возмущения: заметим, что его уменьшение влечет повышение степени
устойчивости замкнутой системы. Согласно теореме, приведенной в [26],
для любого полинома (s) с заданной степенью устойчивости st можно
указать такой вектор , что (s) * s, ,
~
* s, ,
s,
~*
s ad 1 , st s, ,
*
~
* s,
d
s
2
ai1 , st s ai0 , st , d md / 2, где
i 1
ai1 , st 2 st i21 , ai0 , st 2st i21 st i22 ,
(2.10)
ad 1 , st 2d 0 st ,
11 , 12 , 21 , 22 ,..., d 1 , d 2 , d 0 .
Несложно заметить, что
39
0,
*
n1
n1
,
ai0
*
st
i 1
2
st
*i12 st *i 22 2stn11 ,
i 1
из чего следует, что чувствительность фильтра к постоянный воздействиям обратно пропорциональна степени устойчивости замкнутой системы .
~
Для минимизации функционала J (2.9) используется описанный в
главе 1 специализированный спектральный подход к решению задач H 2
оптимизации с одним входом и одним выходом, основанный на распределении управляющего воздействия по каналам, и позволяющий получить
решение задачи (2.8) – (2.9) аналитически. Ниже приведем алгоритм
нахождения оптимальной V0 ( s ) .
Алгоритм 1:
1. Выполнить факторизации
k 2 A( s) A(s) 1 G( s)G(s),
N ( s) N (s) N d ( s) N d (s) P( s) P(s),
(2.11)
где полиномы G(s) и N (s) гурвицевы.
Построить вспомогательный полином
R( s )
n
i 1
N (gi )
G ( s)
,
g i s A( g i )T ( g i )G' ( g i )
(2.12)
где g i , i 1, n – корни полинома G(s) .
2. Сформировать оптимальную передаточную функцию V0 ( s )
V0 (s)
V01 (s)
A(s)T (s) R(s) N (s) / G(s)
,
V02 (s) T (s) R(s) k 2 A(s) N (s) / G(s)
(2.13)
где деление на полином G(s) производится нацело.
Отметим, что характеристический полином (s) в (2.7) имеет вид
(s) N (s)G(s) .
(2.14)
После проведения данных вычислений следует разделить корни полинома
V01 ( s ) на две группы i i 1, n , и j i j 1, n , n n deg(V01 (s)) , т.е.
L0 s
n
s , W s V
i
1
01 ( s ) / L0 ,
W2 s V02 s ,
(2.15)
i 1
40
а затем найти соответствующий вектор L x , такой что
Данный подход, в принципе, можно использовать непосредственно, но он
может быть модифицирован, для повышения чувствительности наблюдателя к низкочастотным воздействиям. Для этого следует деформировать
спектральную плотность (2.3), используя в вычислениях (2.11) - (2.13)
~
вместо N (s) измененный полином N s
~
N ( s) N ( s) N * s ,
(2.16)
где N * s – гурвицев полином с заданной степенью устойчивости (можно
принять ее равной минимальной допустимой степени устойчивости замкнутой системы st ). Данное преобразование позволяет понизить степень
устойчивости полинома (2.14) и, следовательно, повысить чувствительность наблюдателя к низкочастотным возмущениям. Полином N * s может быть параметризован согласно формулам (2.10): N * s N * s, st , .
Поскольку, в этом случае передаточная функция V (s) определяется параметрами k , st , , то функционал
J
также определяется ими, т.е.
J J ( J ( , k , st ) .
На базе всего написанного можно сформулировать алгоритм поиска
оптимальных параметров наблюдателя-фильтра (2.2).
Алгоритм 2:
1. Задать начальные параметры: минимальную допустимую степень
устойчивости st , степень деформирующего полинома n* deg( N * s )
*
начальные значения k k 0 , 0 Rn .
~
2. Вычислить N * s N * s, , st по формулам (2.10), а затем N ( s) (2.16).
3. Вычислить решение задачи (2.9)-(2.10) V s V1 s / V2 s согласно формулам Алгоритма 1 (2.11)-(2.13), а также вектор L и передаточную функцию W (s) в соответствии с (2.15).
4. Вычислить значение J J (L,W ( s)) J ( , k , st ) (2.4).
41
5. Получить вектор * , обеспечивающий минимум J , используя любой
численный метод.
6. Если J J ( * , k , st ) слишком мало изменить k или st .
7. Получить оптимальные k k * , * , st *st . Используя их, вычислить соответствующие L , W (s) .
Рассмотрим пример практического применения данного алгоритма.
Пусть задана математическая модель (2.1), описывающая движение морского судна в горизонтальной плоскости, со следующими параметрами
0.0936 0.634 0
0.0196
0.41
A 0.048
0.717 0 , b E 0.0160 , P 0.0076
0
1
0
0
0
, c 0 0 1 .
Сигнал d t может быть представлен в полигармонической форме,
как сумму трех волн:
d t 0.1sin 0.90t 1sin 0t 0.1sin 1.10t , 0 0.45 .
Исходя
из этого, выберем параметры выражения (2.3)
st 0.01(малое,
чтобы
усилить
частотные
свойства).
0.45 ,
1 0 , 0.1 ,
2 0.9 , 1.1 , n* 2 . Применив Алгоритм 2, получим параметры оп-
тимально фильтра
16,43s 2 1,68s 0,12
.
L 29.57 1.25 1 , W (s) 3
s 6,37s 2 0,26s 1,23
T
На рис. 2.1, 2.2 изображены частотные характеристики передаточных функций Frf (s) , Frd (s) , и процесс обнаружение постоянного сбоя,
соответственно. Можно заметить провал в области центральной частоты
d (t ) , т. е. наблюдатель обладает
выраженными фильтрующими
свойствами.
42
Рис. 2.1. Частотные характеристики передаточных функций Frd и Frf (2.7)
Рис. 2.2 Процесс обнаружения динамического сбоя
43
2.2. Синтез детектора динамических сбоев с применением
спектрального подхода к MIMO H2-оптимизации
Подход к синтезу наблюдателя-фильтра, основанный на SISO H2оптимизации и представленный в предыдущем разделе имеет существенный недостаток, затрудняющий его практическое применение: построенный фильтр подавляет только колебательное возмущение. В ранее рассмотренных [25, 26] примерах, на морское судно воздействует внешнее
возмущение, состоящее из суммы полигармонического колебания и постоянного воздействия
d (t )
Nd
A
di sin(i t
i ) d 0 1(t ) ,
(2.17)
i 1
где Adi , i и i – соответственно амплитуда, частота и фаза учитываемых
гармоник, N d – их количество, d0 – постоянное число и 1(t ) – скалярная
единичная функция. Для того чтобы детектор был невосприимчив к нему
требуется обеспечить дополнительное свойство астатизма.
Рассмотрим линейную стационарную систему
x Ax Bu Ef Hd (t ) ,
y Cx ,
(2.18)
где все переменные имеют тот же смысл, что и в предыдущем разделе, но
предполагается, что x R n , f R f , y R m . Выходной сигнал не является
n
скалярным, что усложняет задачу, но с другой стороны, обеспечивает дополнительные возможности.
Запишем детектор в структуре
xˆ Axˆ Bu ν ,
ν( s) L( s)(y Cxˆ ) ,
~
r Cr (y Cxˆ ) Cr (x xˆ ) ,
(2.19)
где ν(t ) R n – корректирующий сигнал, r (t ) R 1 – остаточный сигнал и
L(s) – передаточная матрица, параметры которой требуется определить во
44
время синтеза детектора. Введем аналогичные (2.5) обозначения
e x x xˆ , e y Ce x y Cxˆ ,
(2.20)
и запишем динамику ошибки оценивания
e x Ae x Ef Hd ν ,
e y Ce x , ν( s) L( s)e y ,
~
r Cr e y Cr e x .
(2.21)
Чувствительность детектора и эффективность фильтрации внешнего возмущения выражается значениями
J J (L,W ( s)) J 0 / J1 ,
J 0 max Frd ( j) , J1 min Frf ( j) ,
(2.22)
1
2
где 1 , 2 – диапазоны частот, характерных для возмущений f и d ,
Frd (s) , Frf (s ) – передаточные функции от возмущения d (t ) и воздействия
сбоя f (t ) к остаточному сигналу r (t ) :
Frd C r sI A L( s)C 1 H ,
1
Frf C r sI A L( s)C E.
(2.23)
Отметим, что J 0 и J 1 – функционалы передаточной матрицы L(s) и задача синтеза наблюдателя (2.20) может быть записана в виде
J (L) min ,
LL
(2.24)
где L – множество L(s) , гарантирующих устойчивость замкнутой системы (2.7) . Кроме того, построенный детектор не должен реагировать на
постоянное внешнее возмущение, т. е. должно выполняться свойство астатизма по выходу r (t ) относительно сигнала d (t ) , сохраняя чувствительность к сбойному воздействию f или
Frd (0) 0 , Frf (0) 0 .
(2.25)
В первую очередь, решим задачу минимизации функционала J 0 , характеризующего подавление полигармонического волнения, с помощью спектрального подхода к среднеквадратичной оптимизации, описанного в пер45
вой главе. Рассмотрим вспомогательную линейную стационарную систему, получаемую транспонированием (2.21)
x 1 A 1 x1 B1u1 H 1 d1 ,
(2.26)
где x1 R n , u1 R m , A1 A T , B1 CT , H1 CTr и d1 R1 – гармоническое возмущение с частотой 0 . Управляющий сигнал u1 (t ) формируется в виде
u1 LT (s)x1 W(s)x1 W(s)21 W1(s)x1 ,
(2.27)
где W1 ( s ) , W2 ( s) – полиномиальные матричные функции размерности
( m n ) and ( m m ) соответственно, и рассмотрим следующий среднеквадратичный функционал
T
1
J 2 (W ) lim
(x1T Rx1 k 2u1T Qu1 ) dt
T T
0
T
(2.28)
1
(e T e k 2u1T Qu1 )dt ,
T T
0
lim
где R HHT , e H T x1 , Q – симметричная положительно определенная
матрица, например единичная, k – положительное число близко к нулю и
сформулируем вспомогательную задачу среднеквадратичной оптимизации
J 2 (W) min ,
W W
(2.29)
где W – множество регуляторов (2.28), таких, что все корни характеристического полинома замкнутой системы
(s) ( As (s))1m det(W1B1s W2 (s) As (s)) , где
B1s (s) As (s)(sI A1 ) 1 B1 , As det(A1 ) ,
(2.30)
расположены в открытой левой полуплоскости. Если рассмотреть передаточную функцию Fed1 ( s) от d1 к e
Fed1 (s) HT (sI A1 ) 1 CTr ,
T
J 0 .
Несложно увидеть, что Fed1 (s) Frd
(s) и J 2 k
0
46
Используя метод, описанный в разделе 2 главы 1, мы получим вектора описывающие динамику замкнутой системы (2.26), (2.27) на
частоте 0 : Fx1 ( j0 ) , Fu1 ( j0 ) , где
Fx1 ( s) ( sI A1 B1W) 1 H1 ,
1
Fu1 ( s) W( sI A1 B1W) H1 .
(2.31)
Они могут быть выражены как функции параметра (s)
(s) (s)Fx1 (s) (s)Fu1 (s) ,
(2.32)
~
~
Fx1 Fx1 () H1s (s) / As (s) B1s (s)1 (s) (s),
~
~
Fu1 Fu 1 () As (s)1 (s) (s), где
(2.33)
следующим образом:
~
0 P 1H1 , (s) As ( s)( s) ( s)B1s ( s),
B1s ( s) As (s)(sI A1 ) 1 B1 , H1s ( s) As ( s)(sI A1 ) 1 H 1,
P( s) (sI A1 ) .
Для вычисления передаточной матрицы 1 (s) необходимо получить значения параметров (s) и (s) , пользуясь походом, предложенным в [21].
Для этого требуется найти решение матричного уравнения Риккати
SA1 A1T S
1
SB1Q 1B1T S R 0 ,
2
k
(2.34)
и использовать его для вычисления:
( s ) 0
1 1 T
Q B1 S , (s) 0 I .
k2
Такая параметризация позволяет ввести обозначения
B1 D1s ( sI A1 B1 0 ) 1 B1 ,
D1s det(sI A1 B1 0 ) ,
(2.35)
и выразить 1 (s) как
1 ( s) 0B1s IA1s 1 A1s1I A1s10 (B1s 0 IA1s )1 B1s
A1s1I A1s10 I P 1B10 P 1B1
1
47
A1s1I A1s1 0 P B1 0 1 B1 A1s1I
1
A1s1 0 D1s1B1
( D1s I 0 B1 ) .
A1s D1s
~
Наконец, получим значение 0 ( j0 )
~
0 ( j0 ) (k 2Q) 1 *1B1*s RH1s / As (s) s j0 ,
(2.36)
и вычислим Fx1 ( j0 ) , Fu1 ( j0 ) , используя его:
~
Fx1 ( j0 ) H1s ( j0 ) / As ( j0 ) B1s ( j0 ) 1 ( j0 ) 0 ( j0 ) ,
(2.37)
~
1
Fu1 ( j0 ) As ( j0 ) ( j0 ) 0 ( j0 ) .
Как следует из Теоремы 4 главы 1, для оптимальности регулятора W(s)
(2.27) необходимо и достаточно выполнение условия:
W( j0 )Fx1 ( j0 ) Fu1 ( j0 ) , или
LT ( j0 )Fx1 ( j0 ) Fu1 ( j0 )
(2.38)
Далее требуется решить вопрос обеспечения астатизма сигнала r (t )
относительно возмущения d , стабилизируя систему с помощью процедуры модального синтеза (1.63)-(1.69). Следует особо отметить, что применение таких подходов как синтез регулятора (2.27) в PID-структуре или в
скоростной форме [26] невозможно в рамках данной задачи, потому что
они подавляют воздействие любого постоянного воздействия, в том числе
вызванного сбоем. Несложно заметить, что значения, характеризующие
чувствительность детектора к постоянным воздействиям d и f , зависит от
матрицы L0 L(0) , что приводит к идее получить условия выполнения
(2.25) аналитически из уравнений, описывающих динамику управляемого
объекта но, ввиду их разнообразия, здесь сложно дать какие либо конкретные указания. Сформулируем такие условия, для динамики морского судна, описанной в предыдущем разделе, обозначив ее параметры как
48
a11 a12
A a 21 a 22
1
0
0
h1
1 0 0 ,
0 , H h2 , C
0 0 1
0
0
предполагая, что измеряются угол дрейфа и курс. Обозначим координаты
матрицы L0 L(0) как lij
l11 l12
L L(0) l21 l22 ,
l31 l32
0
и рассмотрим компоненты вектора A L0 C H :
1
A L0C1 H
1
det A L0C
h1l22 h2l12 a12h2l32 a22h 1l32
a21h1l32 a11h2l32 h2l11l32 h2l12l31 h1l21l32 h1l22l31 .
a21h1 a11h2 h2l11 h1l21 a12h2l31 a22h1l31
Несложно заметить, что последняя компонента полученного вектора зависит только от первого столбца L(s) , и если выбрать C r 0 0 1 , то
Frd (0) 0 эквивалентно равенству
a 21 h1 a11 h2 h2 l11 h1l 21 a12 h2 l 31 a 22 h1l 31 0 .
(2.39)
Наконец, рассмотрим практический пример применения данного
подхода для судна с параметрами аналогичными указанным в предыдущем
разделе, кроме матрицы C , которая предполагается следующей
1 0 0
C
.
0 0 1
Внешнее возмущение, представленное в полигармонической форме, имеет
следующий вид
d (t ) sin(0t ) 0.1sin(0.90t ) 0.1sin(1.10t ) , 0 0.45 .
Задав значения C r 0 0 1 , Q I, k=0.01, вычислим передаточные
функции (2.37)
49
As (s) s 3 0.8106 s 2 0.0367 s ,
0.048
0.048
s 2 0.717 s
B1s ( s) 0.634 s
s 0.094
s 0.094
, H1s ( s)
,
2
0
s 2 0.81s 0.037
s 0.81s 0.037
вычислим решение матричного уравнения Риккати (2.34)
7.94 10 -5
1.628 10 -6
2.335 10 -7
0.0041
S 7.94 10 -5
1.937 10 -6
1.937 10 -6
2.335 10 -7 ,
6.554 10 -6
параметры 0 , 0 согласно (2.35)
40.919 0.7940 0.0194
0
, 0 I ,
0.0194 0.0023 0.0655
получим динамику оптимальной замкнутой системы на частоте 0 :
0.0248 0.04 j
0.485 0.01191j .
Fx1 ( j0 ) 1.34 2.17 j , Fu1 ( j0 )
0.0168
2.184 j
и, принимая во внимание (2.39) , получим
1
s +3.6 s 3.3 s 2+0.73s 0.708
7.43 s 3+9.38 s 2 1.5 s+1.9
s 4 + 4.34 s 3 + 6.58 s 2 + 6.45 s
4.95 s 4 1.1 s 3 + s 2 0.22 s 1.4 10 7
1.37 s 3+1.2 s
.
6.63s 4 5.32 10 4 s 3 1.343s 2
6.227 s 4 0.8s 8.43 10 6
L( s )
4
3
На Рис. 2.3 изображены графики частотных характеристик Ard and Arf передаточных функций Frd и Frf замкнутой системы с параметром L(s) вычисленных в этом разделе. Несложно заметить, что кривая Ard близка к
нулевому значению на нулевой частоте и в окрестности центральной частоты 0 , т. е. воздействие внешнего возмущения d (t ) успешно подавляется. На Рис. 2.4 продемонстрирована работа построенного детектора: на
100 секунде резко повышается интенсивность постоянного внешнего возмущения, но остаточный сигнал r (t ) возвращается в нулевое положение.
50
На 300 секунде произошел сбой, который был успешно обнаружен синтезированным детектором.
Рис. 2.3. Частотные характеристики передаточных функций Frd и Frf
(2.23)
Рис. 2.4. Процесс обнаружения динамического сбоя астатическим
детектором
51
2.3. Синтез H2-оптимального
детектора динамических сбоев в многоцелевой структуре
В данном разделе рассматривается синтез наблюдателя (2.20) в многоцелевой структуре. Ее применение имеет определенные достоинства и
недостатки. С одной стороны, перенастройка на новую частоту и формирование характеристического полинома замкнутой системы осуществляется несколько проще. С другой, присутствует существенный недостаток –
применение вспомогательного наблюдателя удваивает размерность системы, что повышает требования к вычислительным ресурсам.
Основная идея такова: вектор ошибки оценивания e x в свою очередь
подлежит
оценке
наблюдателя,
а
с
помощью
поправочный
вспомогательного
сигнал
асимптотического
формируется
с
помощью
следующей системы
z Az ν L z (e y Cz ) ,
ν L 0Cz ,
(2.40)
K ( s)(e y Cz ) ,
где z – оценка вектора e x , – выход динамического корректора K(s) с
Гурвицевым характеристическим полиномом K (s ) , L 0 – ранее вычисленная матрица базового наблюдателя полного порядка, L z – некоторая
заданная
матрица,
такие
что
полиномы
0 det(A L 0C) ,
z det(A L z C) – Гурвицевы. Ранее, в главе 1, было показано Дополни-
тельно подчеркнем, что передаточная матрица L(s) от e y к ν при прочих
равных однозначно определяются выбором передаточной функции K(s)
корректирующего устройства.
Для обеспечения успешного подавления внешнего возмущения требуется найти соответствующие значения K ( j0 ) и K(0) . Как получить
необходимое значение K ( j0 ) подробно описано в Главе 1: записав урав52
нения (2.40) в частотной области
v T11 (s)ey T12 (s)ξ ,
ζ T21 (s)ey T22 (s)ξ ,
ξ K ( s)ζ , ζ e y C z , где
(2.41)
T ( s) T12 ( s) L0 C
T( s) 11
I n s
T21 ( s) T22 ( s) C
1
0 In
A L0 C L z C L z I n
,
Im 0
и получив выражение L(s)
L(s) T11(s) T12 (s)K(s)I T22 (s)K(s)1 T21(s) ,
выразить из него K(s)
1
1
K ( s) I T121 L( s) T11 T21
T22 T121 L( s) T11 T21
.
1
Подставляя в полученное равенство аргумент s j , получим
1
K ( j) I T121 ( j)L( j) T11( j)T21
( j)T22 ( j)
1
T121 (
j)L( j)
1
T11( j)T21
(
j) .
(2.42)
Очевидно, что значение L( j0 ) может быть получено из уравнения (2.39),
поэтому подробно остановимся на вычислении матрицы L(0) , обеспечивающей выполнение условие (2.26). Очевидно, что при их выполнении
существуют векторы e1 E n , e 2 E n , удовлетворяющие условиям
A L0C1 H e1 , Cr e1 0 ,
A L0C1 E e 2 , Cr e 2 0 ,
(2.43)
которые несложно переписать в виде системы линейных уравнений,
из
которых может быть получено L0 L(0) . Ненулевые координаты векторов
e1 , e 2 могут быть заданы во время процесса синтеза наблюдателя, что
может быть записано как e1 e1 ( γ ) , e 2 e 2 ( γ ) , где γ – вектор задаваемых
параметров. Выбор γ влияет на значение функционалов (2.23) и тоже может быть использован для оптимизации.
53
Исходя из уравнений (2.44), (2.39) получим значения матриц L0
L( j0 ) 0 , а затем найдем по формуле (2.43) требуемые значения корректора K ( j0 ) и K(0) , предварительно задав характеристический полином корректора K (s ) . После этого можно построить замкнутую систему
(2.21), (2.40) и найти значение функционала J , которое может быть рассмотрено как функция параметра γ . Значение, γ γ * , обеспечивающее
минимальное значение функционала качества может быть получено с помощью любого численного оптимизационного алгоритма, например метода Нелдера-Мида.
Рассмотрим практический пример применения описанного выше
подхода в ситуации, аналогичной описанной в предыдущем разделе. Зададим матрицы базового и вспомогательного наблюдателей, порядок корректора
nK 3 ,
полином
K (s )
и
начальное
значение
вектора
γ ( 1 2 5 ) определяющего значения e1 , e 2
0.25
0.51
0.63 0.35
1
3
L 0 0.11 0.20 , L z 1.89 2.91 , e1 2 , e 2 4 ,
1.08
0.09
0.35 1.06
0
5
K (s) s 3 0.7s 2 0.14 s 0.008 , i 1 , i 1, 4 , 5 10 .
После проведения оптимизационной процедуры получим
γ * 0.7106 6.3901 1.2586 0.4409 0.3989 ,
и передаточную матрицу корректора
1
s 3 0.7 s 2 0.14 s 0.008
9.06 s 2 0.72 s 1.43
6.16 s 2 0.544 s 0.87
1.42 s 2 0.22 s 0.27 1.85 s 2 0.49 s 0.372 .
0.21 s 2 1.65 s 0.12
0.6s 2 3.04 s 0.344
K ( s)
На рис. 2.5, 2.6 продемонстрированы графики передаточных функций
Frd , Frf и процесс обнаружения динамического сбоя. Как можно заметить,
54
построенный детектор практически нечувствителен к воздействию по каналу d в области нулевой частоты и 0 .
Рис. 2.5. Частотные характеристики передаточных функций Frd и Frf
Рис. 2.6. Процесс обнаружения динамического сбоя астатическим
детектором в многоцелевой структуре
55
ГЛАВА 3. СПЕКТРАЛЬНЫЙ СИНТЕЗ НАБЛЮДАТЕЛЕЙФИЛЬТРОВ ДЛЯ ОЦЕНИВАНИЯ ВОЗДЕЙСТВИЯ ДИНАМИЧЕСКИХ СБОЕВ
В этой главе описывается решение задачи синтеза асимптотических
наблюдателей для оценки воздействия аддитивных динамических сбоев
(сбойного воздействия). Данная задача имеет особую важность в связи с
тем, что полученная оценка используется в целом семействе методов
управления – активных (active fault tolerant control). В монографиях [15,16]
представлен подробный обзор работ, посвященных данной проблеме и
предложен ряд методов ее решения. Несмотря на их разнообразие, основная идея одинакова: с помощью линейных матричных неравенств и применения метода Ляпунова обеспечить ограниченность воздействия внешнего возмущения на процесс оценки сбойного воздействия и гарантировать определенную степень устойчивости для обеспечения быстродействия. В нашем случае к наблюдателю предъявляются те же требования,
но
для
их
выполнения
используются спектральные методы
H2
оптимизации.
В данной главе представлены два спектральных подхода к синтезу
асимптотических наблюдателей, оценивающих воздействие медленно меняющихся динамических сбоев. Первый из них использует максимально
простой и быстрый алгоритм, который, к сожалению, может быть применен только для систем со скалярным измеряемым сигналом, что существенно сужает область его применения. Второй метод значительно более
универсален, кроме того предлагается вариант его применения в многоцелевой структуре.
56
3.1. Спектральный среднеквадратичный синтез наблюдателейфильтров для оценивания сбойного воздействия
Рассмотрим линейную стационарную систему
x Ax bu Ef Pd ,
y cx,
(3.1)
где x R n0 – вектор состояния объекта, ut , d (t ) , f t , y(t ) – скалярные
управляющий сигнал,
внешнее возмущение, воздействие аддитивного
сбоя и измеряемый сигнал соответственно. Все элементы A, b, c, E, P – заданные
константы.
Предполагается,
что
система
управляема
и
наблюдаема.
Адаптивный наблюдатель, оценивающий действие сбоя имеет вид
(3.2)
где – корректирующий сигнал, а вектор L x , значения lf , l0 и передаточная функция W s W1 s / W2 s – параметры, которые требуется вычислить. Построенный наблюдатель-фильтр должен обеспечивать быструю и
точную оценку действия сбоя fˆ t , несмотря на присутствие внешнего
возмущения. В рамках данной работы предполагается, что что сигнал f
является медленно меняющимся, т.е. f 0 . Введем обозначения:
e x x xˆ , e f f fˆ , e y y yˆ ,
где e x – вектор ошибок оценки состояния объекта, ef – ошибка оценивания сбойного воздействия и ey – ошибка оценки измеряемой координаты и
рассмотрим систему в отклонениях
e x Ae x Ee f L x Pd ,
e f l f ,
(3.3)
s W s e y ,
Добавим новые обозначения
57
z xˆ T
T
fˆ , z R n , e eTx
L LTx
lf
ef
T , e E n ,
T , A
A E
b
, b ,
0 0
0
P
P , c c 0 ,
0
и перепишем уравнения (3.2) и (3.3) как
z Az b u Lv Pd ,
yˆ cz l0 ,
s W s y yˆ ,
e Ae L Pd ,
e y c e l0 ,
(3.4)
(3.5)
W ( s )e y .
Система (3.3) может быть записана в частотной форме:
sA s e y s sL s s E s l f s sP s d s ,
W s e y , где
(3.6)
A s det(A) , L(s) A(s)c(sI A) 1 L x l 0 A(s),
E (s) A(s)c(sI A) 1 E , P(s) A(s)c(sI A) 1 P ,
соответственно, (3.5), (3.6) можно переписать как
~
~
~
A s e y s L s s P s d s ,
s W s e y , где
(3.7)
~
~
~
A s det A sA s , L s A( s) с ( sI A) 1 L l0 sL s l f E ( s) ,
~
~
P s A( s)с ( sI A) 1 P sP s .
~
Рассмотрим возможный случай, когда deg L (s) n , т.e. l 0 0 . Выражение
корректирующего сигнала s может быть переписано
s W s e y W s ( y c z l 0 )
1
W s ( y c z ) ,
1 l 0W s
~
~
~
с использованием обозначения W s W1 s / W2 s
58
~
W1 s
~
~
s ~
( y cz ) , W1 s W1 s , W2 s W2 s l0W1 s .
W2 s
(3.8)
Рассмотрим передаточную функцию от внешнего возмущения d к
ошибке оценивания динамического сбоя e f
e f s Fe f d s d s
l f P s W1 s
2 s
d s ,
(3.9)
где Δ2(s) – характеристический полином замкнутой системы (3.3)
2 s sA s W2 s sL s W1 s l f E s W1 s ,
(3.10)
гурвицевость которого необходимо обеспечить. Внешнее возмущение d (t )
рассматривается как случайный стационарный Гауссов процесс с нулевым
математическим ожиданием и спектральной плотностью мощности:
S d S1 s S1 s s j ,
S1 s N d s T s ,
где N d s и T s – Гурвицевы полиномы. В случае морского волнения,
они имеют следующий вид:
Nd s
4Dr 2 2
,
S1 s
T s s 2 2s s 2
(3.11)
где Dr – дисперсия, β –центральная частота и st , где st – размытость
спектра. Следует отметить, что в случае скалярного внешнего возмущения
постоянный множитель не имеет значения. Так же как и в предыдущей
главе, возможно использование полигармонического описания:
d t
nh
A sin t ,
di
i
i
i 1
где Adi , i , i - амплитуда, частота и фаза соответствующих гармоник.
Теперь введем значения, характеризующие эффективность построенного наблюдателя-фильтра: время T p оценки сбойного воздействия,
число J , характеризующее влияние d t на процесс его оценки
59
J maxAdi Fe f d ji .
(3.13)
i
и перерегулирование J p . Отметим, что T p , J p , J – функции L , W s и
поэтому требуется найти такие L 0 , W0 s , что J L0 , W0 s J 0 ,
T p L0 , W0 s T p0 , J p L0 ,W0 s J 0p где J 0 , T p0 , J 0p – заданные желаемые значения T p , J p , J . Решение данной задачи может рассматриваться
как минимизация функционала
J T p T p0 T p T p0 J J 0 J J 0
Jp
J 0p
Jp
J 0p
(3.14)
.
Можно увидеть, что динамика ошибок оценивания, описанная уравнениями (3.6), а значит и эффективность наблюдателя (3.2), определяется вектором L и передаточной функцией W (s) , обеспечивающими распределение
корректирующего эффекта и подавление внешнего возмущения с заданной
центральной частотой. Для их одновременного поиска может быть использован Спектральный подход к H2-оптимизации, основанный на распределении управляющего воздействия, описанный в первой главе. Введем новый корректирующий сигнал [32],
v~( s) V s e y V1 s / V2 s e y ,
V s L( s)W ( s) ,
и перепишем выражение (3.7) в частотной области
~
~
A s e y s v~ s P s d s ,
v~ V s e .
(3.15)
y
Теперь динамика замкнутой системы (3.15) зависти только от передаточной функции V(s). Введем среднеквадратичный функционал
1
~ ~
J J (V ) lim
T T
T
2
2~ 2
e
t
k
v t dt
y
0
e y 2 k 2 v~ 2 min , (3.16)
V
где второе слагаемое можно рассматривать как интенсивность процесса
60
оценки, из-за его пропорциональности e f . Параметр k характеризует компромисс между чувствительностью к внешнему возмущению и степенью
устойчивости замкнутой системы,
т.е. скоростью оценки воздействия
сбоя. Следует отметить, что если функционал (3.16) спроектирован в экономическом режиме, т. е. с достаточно большим значением k, числитель
передаточной
функции
сопряженных корней
W (s)
должен
иметь
пару
комплексно-
близких к значениям j чтобы гарантировать
фильтрующие свойства. Также следует обратить внимание на то, что характеризующий воздействие волнения полином N s , определяемый равенством
N s N s s 2 P s P s N d s N d s ,
где P s – Гурвицев полином, является делителем характеристического
полинома (3.10) замкнутой системы (3.5) и N s должен быть Гурвицевым, чтобы обеспечить устойчивость замкнутой системы. Один из спосо~
бов решения этой проблемы – заменить полином N s на Гурвицев N s
~ ~
N s N s s p s p P s P s N d s N d s ,
(3.17)
где параметр p 0 также может быть использован для оптимизации.
Наконец, можно сформулировать алгоритм синтеза наблюдателя
Алгоритм 3.
1. Вычислить
~
A s det Is A , P s A s c Is A 1 P,
Ci s , i 1, n, где C1 s C 2 s C n s A s c Is A 1 .
2. Задать параметры k и p в (3.14), (3.5). Выполнить факторизацию
полиномов
~ ~
k 2 A s A s 1 G s G s ,
P s P s P1 s P1 s ,
(3.18)
~
где G s и P1 s – Гурвицевы полиномы. Получить полином N s (3.17):
61
~
N s s p P1 s N d s .
(3.19)
3. Построить полином
R s
n
i 1
~
N gi
G s
.
~
g i s A g i T g i G' g i
(3.20)
4. Вычислить передаточную функцию
V V s V10 s / V20 s ,
~
~
V10 s A s T ( s) R s N s / G(s) ,
~
~
V20 s T s R( s) k 2 A(s) N s / G(s) ,
(3.21)
где деление на G s осуществляется нацело.
5. Выбрать n (или меньше, если необходимо) корней i полинома V1 s .
Построить полиномы
L s
n
s l
i
0n s
n
l0( n1) s n1 l0( n2) s n2 l01s l00 ,
i 1
(3.22)
W01 s V01 s L0 s ,
причем комплексно сопряженные корни i ,i 1 наиболее близкие к j
должны быть корнями, чтобы обеспечить фильтрующие свойства наблюдателя-фильтра.
6. Составить два вектора
l s 0 l0 n1 l0 n2 l01 l00 T ,
a s an1 an2 a1 a0 T ,
из коэффициентов полиномов
L0 s l 0n s n l 0( n1) s n1 l 0( n2) s n2 l 01 s l 00 ,
A( s) s n a n1 s n1 a n2 s n2 a1 s a0 ,
соответственно, а также матрицу
62
c1 n 1
c1 n 2
Cs
c11
c10
c 2 n 1
c 2 n 2
c 21
c 20
c n n 1
c n n 2
,
c n1
c n0
из коэффициентов полиномов
Ci (s) ci ( n1) s n1 ci ( n2) s n2 ci1s ci 0 , i 1, n .
7. Задать l 0* l 0n и найти L L0 , решив систему
Cs L l s 0 l0*a s .
8. Найти
передаточную
функцию
(3.23)
фильтра
W s
(3.3)
W0 s W01 s W02 s , где W02 s V02 s . Затем получить оптимальную
~
W0 s
~
W01 s
W01 s
~
.
W0 s ~
W02 s W02 s l 0*W01 s
(3.24)
~
9. Записать W0 s в пространстве состояний
A W BW ( y cz ) ,
CW DW ( y cz ) ,
(3.25)
получая вслед за этим наблюдатель-фильтр (3.4)
z A LDW с LDW z b u LDW y ,
AW 0 BW
BW с
fˆ 0 00 1 z .
n0
10. Вычислить значение функционала (3.14) J J ( L 0 , W0 ) . Если оно не
близко к нулю, то следует минимизировать его J , повторяя шаги 2-10 с
новыми параметрами k , p , найденными любым численным методом или
перебором. Получить оптимальные параметры k k * , p p * .
63
11. Вычислить L L 0 ,
W ( s) W0 ( s) , используя оптимальные значения
параметров k * , p * .
Продемонстрируем практическое применение предложенного алгоритма на рассмотренной в предыдущей главе математической модели,
описывающей движение морского судна в горизонтальной плоскости с постоянной скоростью. Зададим параметры модели (3.1), предполагая, что
сбойное воздействие действует в том же направлении, что и управляющее.
0.0936 0.634 0
0.0196
0.41
A 0.048
0.717 0 , b E 0.0160 , P 0.0076
0
1
0
0
0
c 0 0 1 .
,
Внешнее возмущение d t может быть представлено в виде (3.11) со следующими параметрами
Dr 1.52 10 4 , 0 0.45 , st 0.01 ,
или в полигармоническом представлении
d (t ) sin(0t ) 0.1sin(0.90t ) 0.1sin(1.10t ) .
Зададим желаемые значения функционалов T p , J p , J : J 0 0.01 ,
J 0p 0.05 , Tp0 22 и применим описанный выше алгоритм, c начальными
значениями k 50 , p 0.1. Были получены оптимальные параметры
p* 0.1 , k * 100 . В этом случае мы получим оптимальные параметры
наблюдателя
L 1.037 0.133 1 3.078T , l 0* 0 ,
~
и передаточную матрицу фильтра W0 s
~
W01 s (1.81 s 2 0 .03 s 0 .036)
~
W0 s ~
,
W02 s
( s 2 0 .139 s 1.27)
имеющую реализацию в пространстве состояний (3.25)
64
1. 39 1. 27
2
AW
, BW , CW 1. 25 0 . 97 , DW 1.81.
0
1
0
На рис. 3.1 представлена частотная характеристика замкнутой системы с вычисленными параметрами. Кривая Aω имеет выраженнный провал в области центральной частоты 0 , т. e. построенный фильтр обеспечивает фильтрацию внешнего возмущения. Рассмотрим сбойное воздействие f (t ) вида
/ 6 , 300 t 500,
f (t )
0 , t 300, 500 ,
и изобразим график его оценки на рис. 3.2. Построенный наблюдатель
успешно оценивает сбойное воздействие. Отметим, что скорость оценки
может быть увеличена за счет варьирования параметра lf , но его существенное увеличение привести к потере устойчивости.
Рис. 3.1. Частотная характеристика Fe f d s
Рис. 3.2. Процесс оценки сбоя.
65
3.2. Спектральный среднеквадратичный синтез оценивающих наблюдателей-фильтров в многоцелевой структуре
В данном разделе предлагается метод синтеза асимптотических
наблюдателей, оценивающих воздействие на аддитивных динамических
сбоев, который может быть применен в более общем случае чем предложенный выше. Также описывается синтез наблюдателя в многоцелевой
структуре, обеспечивающей возможность задать желаемые корни ее характеристического полинома без сложных вычислений.
Динамика объекта задается линейной стационарной системой
x Ax Bu Ef Hd ,
y Cx ,
(3.26)
все переменные имеют тот же смысл что и в (3.1), но допускается многомерность y E m , f E f . Наблюдатель, для оценки воздействия динамиn
ческого сбоя, имеет структуру
xˆ Axˆ u Efˆ ν x ,
yˆ cxˆ ,
fˆ ν f ,
ν x s L x s y yˆ ,
ν f s L f s y yˆ ,
(3.27)
где ν x , ν f – корректирующие сигналы, L x s , L f s – передаточные матрицы, параметры которых требуется определить. Запишем систему в отклонениях относительно переменных e x x xˆ , e y Ce x , ef f fˆ :
e x Ae x Eef ν x Hd ,
e f ν f ,
ν x s L x s y yˆ ,
ν f s L f s y yˆ ,
(3.28)
после чего, введем обозначения
66
T
T
xˆ xˆ T fˆ T , xˆ E n , e eTx efT , e E n , ef Cf e ,
A E
L
B
H
L x , A
, B , , H ,
0 0
0
0
Lf
ν ν Tx
νfT , C C 0 , Cf (0 I n f ) .
T
и запишем систему (3.28) как
e Ae ν Hd ,
ey C e ,
(3.29)
ν L ( s)e y .
Внешнее возмущение аналогично описанному в предыдущей главе. Качество процесса оценки сбоя определяется с помощью функционала вида
(3.14). В первую очередь обеспечим минимизацию воздействия гармонических колебаний на процесс оценивания сбойного воздействия, минимизируя значение Fef d ( j0 ) , где 0 – центральная частота d , а Fef d (s) – передаточная функция от d r
Fef d ( s) Cf ( sI A L ( s)) 1 H .
(3.30)
Аналогично предыдущей главе рассмотрим вспомогательную линейную
стационарную систему, получаемую транспонированием (3.29)
x 1 A 1 x1 B1u1 H 1 d1 ,
(3.31)
где x1 E n , u1 E m , A1 A T , B1 C T , H1 CfT и d1 R nf – гармоническое возмущение с частотой 0 . Управляющий сигнал u1 (t ) формируется в виде
u1 LT (s)x1 W(s)x1 W(s) 21 W1 (s)x1 ,
(3.32)
где W1 ( s ) , W2 ( s) – полиномиальные матричные функции размерности
(m×n) и (m×m) соответственно, и рассмотрим следующий среднеквадратичный функционал
67
T
1
J 2 (W ) lim
(x1T Rx1 k 2u1T Qu1 ) dt
T T
0
(3.33)
T
1
(e 2 k 2u1T Qu1 )dt ,
T T
0
lim
где e H T x1 , Q – симметричная положительно определенная матрица,
например единичная, k – положительное число близкое к нулю, а
~
~~
R HH T и H – деформированная H , вида , H H T
I , где – малое
T
вещественное число. Деформация осуществляется для того, чтобы избежать вырожденности при решении матричного уравнения Риккати (1.49).
Затем сформулируем вспомогательную задачу среднеквадратичной оптимизации
J 2 (W) min ,
W W
(3.33)
где W – множество регуляторов W(s) (3.32), таких, что все корни характеристического полинома замкнутой системы
(s) ( As (s))1m det(W1B1s W2 (s) As (s)) , где
1
B1s (s) As (s)(sI A1 ) B1 , As det(A1 ) ,
(3.34)
расположены в открытой левой полуплоскости. Если рассмотреть передаточную функцию от d1 к e Fed1 (s)
Fed1 (s) HT (sI A1 B1W1 ) 1 CfT ,
Несложно увидеть, что Fed1 (s) FeTf d (s) и J 2 k
J 0 .
0 , 0
Опустим описание решения задачи минимизации функционала J 2 ,
поскольку оно полностью идентично описанному в предыдущей главе.
После вычисления значений Fx1 ( j0 ) , Fu1 ( j0 ) получим условие оптимальности
LT ( j0 )Fx1 ( j0 ) Fu1 ( j0 ) ,
(3.35)
и найдем комплекснозначную матрицу 0 , такую что
68
0T Fx1 ( j0 ) Fu1 ( j0 ) .
Допустим, что ранее был построен наблюдатель полного порядка (3.27) с
L ( s) L0 , где L0 – матрица с постоянными элементами, и задана матрица
L z , причем полиномы 0 det(A L0 C) , z det(A L z C) – Гурвицевы. Тогда синтез оценивающего наблюдателя может быть осуществлен в
многоцелевой структуре вида
z Az ν L z (e y Сz ) ,
ν L 0 Сz K ( s)(e y Сz ) ,
(3.36)
где z E n – оценка вектора e , а K(s) – передаточная матрица динамического корректора, являющаяся устойчивой системой с характеристическим
полиномом K (s) , который может быть задан в процессе синтеза наблюдателя. Как ранее было показано, характеристический полином системы
(3.29) замкнутой обратной связью (3.36) ( s) 0 ( s) z ( s) K ( s) .
Теперь требуется построить такой корректор, чтобы передаточная
матрица L(s) от e y к поправочному сигналу ν удовлетворяла равенству
L( j0 ) 0 . Записав уравнения (3.36) в частотной области
v T11 (s)ey T12 (s)ξ ,
ζ T21 (s)ey T22 (s)ξ ,
ξ K ( s)ζ , ζ e y Cz , где
T ( s) T12 ( s) L 0 C
T( s) 11
I n m s
T21 ( s) T22 ( s) C
1
0 In
A L 0 C L z C L z I n
.
Im 0
и получив выражение L(s)
L(s) T11(s) T12 (s)K(s)I T22 (s)K(s)1 T21(s) ,
выразим из него K(s)
1
1
K ( s) I T121 L( s) T11 T21
T22 T121 L( s) T11 T21
.
1
69
Подставляя в полученное равенство аргумент s j0 , получим условие
выполнения равенства (3.35)
1
K ( j0 ) I T121 ( j0 )0 T11 ( j0 )T21
( j0 )T22 ( j0 )
1
1
T121 ( j0 )0 T11 ( j0 )T21
( j0 ) .
Следует подчеркнуть, что за счет выбора полинома K (s) необходимо добиться компромисса между временем T p оценки сбойного воздействия и
влиянием волнения d t на процесс ее процесс. Для решения этой проблемы K (s) может быть параметризован согласно формулам (2.10)
K ( s) K ( s , st , ) , где st – желаемая степень устойчивости, а – вектор параметров, которые используются для минимизации функционала
(3.14). Для этого может быть использован любой численный метод,
например, метод Нелдера-Мида.
Рассмотрим применение такого метода на конкретном примере с параметрами управляемого объекта и внешнего возмущения аналогичными
заданным в предыдущем разделе данной главы. Базовый и вспомогательный наблюдатели имеют параметры
- 236251
1.03
562.152
0.25
Lz
,L
,
33.689 0 0.71
840388
10
Зададим степень K nK 2 , st 0.05 , начальное значение 0 (1 1) а
также желаемые значения T p , J p , J : J 0 0.02 , J 0p 0.1 , T p0 12 . Минимум функционалу (3.14) доставляет значение * (0.0324 0.3335) ,
которому соответствует корректор
5288 s 892.1
1279 s 215.8
1
K ( s) 2
.
s 0.101 s 0.12 3619 s 610.6
51166 .7 s 8638
70
На рис. 3.3, 3.4 представлены частотная характеристика передаточной
функции Fef d (s) замкнутой системы с вычисленными параметрами и процесс оценки динамического сбоя, происходящего с 200 с по 400 с.
Рис. 3.3. Частотная характеристика Fe f d s
Рис. 3.4. Процесс оценки сбоя.
71
ЗАКЛЮЧЕНИЕ
Содержание работы составляет развитие спектральных методов
среднеквадратичной оптимизации и их применение к синтезу адаптивных
наблюдателей для обнаружения и оценки воздействия динамических
сбоев.
Основными результатами, которые получены на основе проведенных исследований и выносятся на защиту, являются следующие.
1. Усовершенствован спектральный подход к решению задач оптимизации по норме H2. Получены условия оптимальности управления, гарантирующие не единственность решения, что позволяет использовать
многоцелевую структуру управления и обеспечивать дополнительные
свойства замкнутой системы.
2. Предложены спектральные методы синтеза асимптотических
наблюдателей для обнаружения и оценки медленно меняющихся динамических сбоев.
3. Разработаны методы синтеза адаптивных наблюдателей, в том
числе астатических, в многоцелевой структуре.
4. Работоспособность и эффективность предложенных методов проверена на примере математической модели управления движением морского судна под действием волнения, а также ветра и морского течения
72
ЛИТЕРАТУРА
1.
Ding S. X. Model-Based Fault Diagnosis Techniques: Design
Schemes, Algorithms and Tools. –Springer Science & Business Media, 2012.
2.
Chen J., Patton R. J. Robust model-based fault diagnosis for dy-
namic systems. – Springer Science & Business Media, 2012. – T. 3.1.
3.
Witczak M. Fault Diagnosis and Fault-Tolerant Control Strategies
for Non-Linear Systems: Analytical and Soft Computing Approaches. – Springer Science & Business Media, 2013.
4.
Zanoli S. M. et al. Application of Fault Detection and Isolation
Techniques on an Unmanned Surface Vehicle (USV) // IFAC Proceedings Volumes. – 2012. – T. 45. – №. 27. – С. 287-292.
5.
Wang Y., Ma X., Qian P. Wind turbine fault detection and
identification
through
PCA-based
Transactions
on
Sustainable
optimal
variable
Energy.
–
selection
//IEEE
2018.
DOI=
10.1109/TSTE.2018.2801625.
6.
Janssens O. et al. Convolutional neural network based fault
detection for rotating machinery // Journal of Sound and Vibration. – 2016. –
Т. 377. – С. 331-345. DOI= 10.1016/j.jsv.2016.05.027.
7.
Zhang W. et al. A deep convolutional neural network with new
training methods for bearing fault diagnosis under noisy environment and
different working load // Mechanical Systems and Signal Processing. – 2018. –
Т. 100. – С. 439-453. DOI= 10.1016/j.ymssp.2017.06.022.
8.
Isermann R. Process fault detection based on modeling and
estimation methods—A survey // Automatica. – 1984. – T. 20. – №. 4. – С. 387404.
9.
Mohanty R., Pradhan A. K. Protection of Smart DC Microgrid with
Ring Configuration using Parameter Estimation Approach // IEEE Transactions
on Smart Grid. – 2017. DOI= 10.1109/TSG.2017.2708743.
73
Wang Z., Shi P., Lim C. C. H−∕ H∞ fault detection observer in finite
10.
frequency domain for linear parameter-varying descriptor systems //
–
Automatica.
2017.
–
Т.
86.
–
С.
38-45.
DOI=
10.1016/j.automatica.2017.08.021.
11.
Chadli M., Abdo A., Ding S. X. H−/H∞ fault detection filter design
for discrete-time Takagi–Sugeno fuzzy system // Automatica. – 2013. – Т. 49. –
№. 7. – С. 1996-2005. DOI= 10.1016/j.automatica.2013.03.014.
12.
Su X. et al. Fault detection filtering for nonlinear switched
stochastic systems // IEEE Transactions on Automatic Control. – 2016. – Т. 61.
– №. 5. – С. 1310-1315. DOI=10.1109/TAC.2015.2465091.
13.
systems
//
Li H. et al. Fault-tolerant control of Markovian jump stochastic
via
Automatica.
the
–
augmented
2014.
–
Т.
sliding
50.
–
mode
№.
observer
7.
–
С.
approach
1825-1834.
DOI=/10.1016/j.automatica.2014.04.006.
14.
Wu L., Yao X., Zheng W. X. Generalized H2 fault detection for
two-dimensional Markovian jump systems // Automatica. – 2012. – Т. 48. – №.
8. – С. 1741-1750. DOI=10.1016/j.automatica.2012.05.024.
15.
Zhang K., Jiang B., Shi P. Observer-Based Fault Estimation and
Accommodation
for
Dynamic
Systems.
Berlin:
Germany:
Springer-Verlag.–2013.
16.
Zhang K. et al. Observer-Based Fault Estimation Techniques. –
Springer, 2018.
17.
Serbák V., Liščinský P. Additive faults estimation based on
adaptive observers for linear systems // Carpathian Control Conference (ICCC),
2015 16th International. – IEEE, 2015. – С. 475-480.
18.
Filasova A., Krokavec D., Serbak V. Application of descriptor
approaches in design of PD observer-based actuator fault estimation // Archives
of Control Sciences. – 2015. – Т. 25. – №. 1. – С. 51-64.
74
19.
Krokavec D. et al. An enhanced approach to actuator fault
estimation design for linear continuous-time systems // Journal of Physics.
Conference Series (Online). – 2014. – Т. 570. – №. 7.
20.
Filasová A., Gontkovič D., Krokavec D. Observer-based fault
estimation for linear systems with distributed time delay // Archives of Control
Sciences. – 2013. – Т. 23. – №. 2. – С. 169-186.
21.
Алиев Ф. А.,
Ларин В. Б.,
Науменко К. И.,
Сунцев В. Н.
Оптимизация линейных инвариантных во времени систем управления. –
Киев: Наукова думка, 1978. – 327 с.
22.
Aliev F. A., Larin V. B. Parametrization of sets of stabilizing
controllers in mechanical systems //International Applied Mechanics. – 2008. –
T. 44. – №. 6. – С. 599. DOI= https://doi.org/10.1007/s10778-008-0085-3.
23.
Veremey E. I. Efficient Spectral Approach to SISO Problems of
H2-Optimal Synthesis // Applied Mathematical Sciences. – 2015. – T. 9. – №.
79. – С. 3897-3909. DOI= 10.12988/ams.2015.54335.
24.
Veremey E. I. H2-Optimal Synthesis Problem with Nonunique
Solution // Applied Mathematical Sciences. – 2016. – T. 10. – №. 38. – С.
1891-1905. DOI= 10.12988/ams.2016.63120.
25.
Veremey E. I. Dynamical correction of control laws for marine
ships’ accurate steering // Journal of Marine Science and Application. – 2014. –
T. 13. – №. 2. – С. 127-133. DOI= 10.1007/s11804-014-1250-1.
26.
Веремей
Е.
И.
Среднеквадратичная
многоцелевая
оптимизация. – Спб. Издательство Санкт-Петербургского Университета,
2017, 408 с.
27.
Veremey E., Sotnikova M. Spectral Approach to H∞-Optimal SISO
Synthesis Problem // WSEAS Trans. Syst. Control. – 2014. – Сер. 9. – №. 43. –
С. 415-424. DOI=10.12988/ams.2015.54335.
75
28.
Veremey E. Irregular H∞-optimization of control laws for marine
autopilots // Constructive Nonsmooth Analysis and Related Topics (dedicated
to the memory of VF Demyanov)(CNSA), 2017. – IEEE, 2017. – С. 1-4. DOI=
10.1109/CNSA.2017.7974028.
29.
Veremey E. I., Smirnov M. N., Smirnova M. A. Synthesis of
stabilizing control laws with uncertain disturbances for marine vessels //
"Stability and Control Processes" in Memory of VI Zubov (SCP), 2015
International
Conference.
–
IEEE,
2015.
–
С.
1-3.
DOI=
10.1109/SCP.2015.7342219.
Собственные публикации по теме
30.
Veremey E. I., Knyazkin Y. V. Spectral H2 optimal correction of
additive fault estimation observer //6th Seminar on Industrial Control SystemsAnalysis, Modeling and Computation. – EDP Sciences, 2016. DOI=
10.1051/itmconf/20160601005 (SCOPUS, ВАК, WoS CC).
31.
Veremey E., Knyazkin Y. SISO problems of H2-optimal synthesis
with allocation of control actions // WSEAS Transactions on Systems and
Control. – 2017. – Т. 12. – С. 193-200, (SCOPUS).
32.
Veremey E. I., Knyazkin Y. V. Spectral H2 fault estimation
observer design based on allocation of the correction effect // Journal of
Theoretical and Applied Information Technology. – 2017. – Т. 95. – №. 12. –
С. 2776-2782, (SCOPUS).
33.
Князькин Я. В. Спектральный синтез H2-оптимального
детектора динамических сбоев // Процессы управления и устойчивость.
2017. – Т. 4(20). – № 1. – С. 394-400, (РИНЦ).
34.
Князькин
Я.
В.
Сингулярный
синтез
H∞-оптимального
морского автопилота c многоцелевой структурой // Системы управления и
информационные технологии. – 2018. – С. 39-42, (РИНЦ, ВАК).
76
35.
Veremey E. I., Knyazkin Y. V. H∞-optimal synthesis problem with
nonunique solution. // Selected Papers of the II International Scientific
Conference "Convergent Cognitive Information Technologies" (Convergent
2017) 2017 – C. 270-276. (SCOPUS)
36.
Веремей Е. И., Князькин Я. В.Синтез детектора динамических
сбоев с применением спектрального подхода к MIMO H2-оптимизации //
Современные информационные технологии и ИТ-образование. – 2018. –
Т. 14. – № 1. – С. 87-97, (РИНЦ, ВАК)
77
Отзывы:
Авторизуйтесь, чтобы оставить отзыв