Например, Бобцов

СУБОПТИМАЛЬНОЕ УПРАВЛЕНИЕ НЕЛИНЕЙНЫМИ МУЛЬТИАГЕНТНЫМИ СИСТЕМАМИ

И.Б. Фуртат

УДК 519.7

СУБОПТИМАЛЬНОЕ УПРАВЛЕНИЕ НЕЛИНЕЙНЫМИ МУЛЬТИАГЕНТНЫМИ СИСТЕМАМИ 2
И.Б. Фуртат

Рассмотрена проблема робастного субоптимального управления мультиагентными системами, модель которых представлена дифференциальными уравнениями с липшицевой нелинейностью. При решении предполагается, что доступны измерению только скалярные выходы подсистем. Получен алгоритм децентрализованного управления, обеспечивающий компенсацию неопределенностей и субминимизацию интегрального критерия качества с заданной точностью. Ключевые слова: мультиагентная система, робастное управление, децентрализованное управление, оптимальное управление, компенсация возмущений.

Введение

Задача компенсации неконтролируемых возмущений была и остается актуальной проблемой в теории управления. В настоящее время решение этой задачи имеет два основных направления. Первый подход основан на построении инвариантных систем управления, т.е. когда система управления малочувствительна или не реагирует на неконтролируемые возмущения. Такой подход получил широкое
применение, например, в H-оптимизации [1] или в методе вложения систем [2]. Второй подход основан на динамической компенсации неизвестных воздействий. Суть данного подхода заключается в оценке возмущений и затем выборе структуры и параметров управляющего устройства с целью исключения влияния неопределенностей на объект управления. Так, в [3, 4] внешние возмущения представлены в виде системы дифференциальных уравнений, которые с помощью методов адаптивного и робастного управления компенсируются. В [5], на базе подхода [6], предложена схема робастного субоптимального управления с минимизаций интегрального критерия качества.
В настоящей работе рассматривается обобщение схемы [5] на случай робастного субоптимального децентрализованного управления нелинейными мультиагентными системами по выходу. Для выделения неконтролируемых возмущений и обеспечения субоптимального управления параллельно объекту предлагается ввести вспомогательный контур определенной структуры. Далее возмущения оцениваются и компенсируются с заданной точностью за конечное время. Приводятся результаты моделирования, подтверждающие аналитические выводы и расчеты.

Постановка задачи

Пусть управляемая и наблюдаемая мультиагентная система с перекрестными связями по состоя-

нию задана дифференциальным уравнением

k

x i (t)  Ai (t)xi (t)  Bi (t)ui (t)  Ψi  yi (t), t  Ni (t) 

Sij (t)x j (t)  Di (t) fi (t),

j 1,i  j

(1)

yi (t)  Li xi (t), xi (0)  x0i , i  1, k, где xi (t)  Rni – вектор состояния i-й подсистемы; ui (t) , fi (t) и yi (t) – скалярные вход, внешнее неизвестное ограниченное воздействие и выход соответственно; Ai (t)  Rni ni , Ni (t)  Rni , Sij (t)  Rni ni ,

 Ψi yi (t), t  Rni ni , Bi (t)  Rni , Di (t)  Rni , Li = [1, 0, …, 0]; x0i – известные начальные условия; k – ко-

личество подсистем. Необходимо синтезировать непрерывный закон управления, обеспечивающий пере-

вод объекта (1) из начального положения yi (0) в конечное yi (tfi) за заданное время tfi, при этом миними-

зируя критерий качества t

fi

  Ji  qi yi2 (t)  riu02i (t) dt ,

(2)

0

с малой погрешностью [5], qi  0 и ri  0 – весовые коэффициенты, функция u0i (t) определяет оптимальный закон управления [2].

Предположение 1. Элементы матриц Ai (t), Bi (t), Ni (t), Sij (t) и Di (t) – неизвестные ограниченные функции. Известно множество  возможных значений этих функций.

Предположение 2. Выполнены условия: Ai (t)  ANi  BNicTi (t) , Bi (t)  BNi  BNii (t) ,

Di (t)  BNi ki (t) , Ni (t)  BNii (t) , Sij (t)  BNiTij (t) , где ANi  Rni ni , BNi  Rni – известные матрицы, при-

2 Работа выполнена при поддержке ФЦП «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007–2013 годы», государственный контракт № 11.519.11.4007.

Научно-технический вестник информационных технологий, механики и оптики, 2013, № 1 (83)

19

СУБОПТИМАЛЬНОЕ УПРАВЛЕНИЕ НЕЛИНЕЙНЫМИ МУЛЬТИАГЕНТНЫМИ …

чем собственные числа ANi не лежат в правой полуплоскости комплексной плоскости, ci (t)  Rni , i (t)  R , ki (t)  R , i (t)  R и ij (t)  Rni – неизвестные функции.
Предположение 3. Неизвестные элементы матрицы i (yi (t), t) удовлетворяют глобальному условию Липшица по yi (t), ограничены по t и являются гладкими функциями.
Предположение 4. Объект (1) – минимально фазовый, последние коэффициенты Bi (t) и BNi – положительные функции и число.
Предположение 5. В системе управления доступны измерению только yi (t) и ui (t).
Метод решения

С учетом предположения 2 преобразуем уравнение объекта (1) к виду

x i (t)  ANi xi (t)  BNiui (t)  BNii (t), yi (t)  Lixi (t), xi (0)  x0i ,

k

где i (t)  cTi (t)xi (t)  i (t)ui (t)  i  yi (t), t  i (t) 

Tij (t)x j (t)  ki (t) fi (t) .

j 1,i  j

(3)

Рассмотрим номинальный объект (когда в (3) i (t)  0):

x i (t)  ANi xi (t)  BNiui (t), yi (t)  Li xi (t), xi (0)  x 0 i .

(4)

Для номинального объекта (4) критерий качества (2) и оптимальный закон управления u0i (t) опре-

делятся в виде [7]

t fi

  Ji 

xTi (t)Q i xi (t)  riu02i (t) dt,

u0i

(t)



ri

B1 T Ni

z

22,i

(t )z121,i

(t)xi

(t)



u0i

(t),

(5)

0

  где

Q i  qidiag 1, 0, ..., 0 ,

u0i

(t)



ri

B1 T Ni

z21,i (t)  z22,i (t)z121,i (t)z11,i (t)

xi (t fi ) ,

zi (t)  xTi (t), wTi (t)T ,

w i (t)  Q i xi (t)  ATNiwi (t) ,

z i (t)  Dizi (t) ,

Di



  

A Ni Q i

ri

1B Ni BTNi ATNi

  

,

Zi (i )  eDii



 z11,i

 

z

21,i

(i (i

) )

z12,i z 22,i

(i (i

) )

,

zi (t)  Zi (i )zi (t fi ) , i  t  t fi .
Добавим и вычтем в (3) u0i (t) из (5) и преобразуем уравнение (3) к виду x i (t)  A0i (t)xi (t)  BNiu0i (t)  BNiui (t)  BNi1i (t), yi (t)  Li xi (t), xi (0)  x0i ,
где ,A0i (t)  ANi  ri1BNiBTNiz22,i (t)z121,i (t) (t)  (t)  u0i (t) .
Для выделения этих неопределенностей введем вспомогательный контур [5, 6] x ai (t)  A0i (t)xai (t)  BNiu0i (t)  iBNiui (t), yai (t)  Li xai (t), xai (0)  x0i ,
где i > 0. Составим функцию i (t) = xi (t) – xai (t), вычитая из (6) уравнение (7):
 i (t)  A0i (t)i (t)  BNiφi (t), i (t)  Lii (t), i (0)  0 .

(6)
(7) (8)

Здесь i (t)  Rni , φi (t)  1 i ui (t)  i (t) . Преобразуем (8) к форме вход–выход:

Q0i ( p, t)i (t)  RNi ( p)φi (t) ,

(9)

где Q0i (p, t), RNi (p) – линейные дифференциальные операторы, полученные при переходе от (8) к (9) при фиксированном параметре t.

Для компенсации возмущений в (1) функцию ui (t) зададим в виде

ui

(t)



i1

R 1 Ni

(

p)Q0i

(

p,

t)i

(t)

,

(10)

где i (t) – оценка i (t). Для реализации алгоритма (10) рассмотрим наблюдатель [8]
  i (t)  G0ii (t)  D0i i (t)  i (t) , i (t)  Lii (t) .

(11)

Здесь

i (t)  Rni ,

G0i



0 0

Ini 1 0

  

,

I ni 1



единичная

матрица

порядка

ni – 1,

D0i



 d1i1,

d 2i  2

,

...

,

d ni ni i

T

,

d1i , d2i , ... , dnii

выбираются из условия гурвицевости матрицы

Gi  G0i  DiLi , Di  d1i , d2i , ... , dnii T , µ > 0 – малое число.

 Введем вектор отклонений i (t)  Гi1 i (t)  i (t) , где Гi  diag ni 1, ni 2 , ... , , 1 ,

i (t)



i (t),

 i (t), ... ,



( i

ni

)

(t

)

T

.

Продифференцировав

i (t)

по времени с учетом уравнения (11), полу-

чим:

 i

(t)



 1G i

i

(t)



bi



( i

ni

1)

(t)

,

i (t)  ni 1Lii (t) . Преобразуем предпоследние уравнения

к виду

 i (t)  1Gi i (t)  bi i (t), i (t)  ni 1Li i (t) .

(12)

20 Научно-технический вестник информационных технологий, механики и оптики,
2013, № 1 (83)

И.Б. Фуртат

Здесь

li

(t)



il

(t)



1l ni

(l 1) i

(t)

,

l  2, ni ,

ik (t)

и

il (t)

– l-е компоненты векторов i(t) и

i (t) ,

1i (t)  il (t) , bi  2ni , 0, ... , 0T . Очевидно, что последние два уравнения эквивалентны относительно

переменных 1(t)  i (t) . Принимая во внимание (11) и (12), преобразуем уравнение (10) к виду

x i (t)  A0i (t)xi (t)  BNiu0i (t)  ni 1bigTi i (t), yi (t)  Li xi (t) ,

(13)

 где

(t)  1i (t), 1i (t), ... ,

1i (t)

(ni )

T 

,

gi



вектор,

составленный

из

коэффициентов

оператора

Q0i (p,

t)

и

записанных в обратном порядке.

Утверждение. Пусть выполнены условия предположений. Тогда существует числа i > 0 и µ0 > 0 такие, что при µ ≤ µ0 система управления (7), (10), (11) обеспечивает переход объекта (1) из начального положения yi (0) в конечное yi (tfi) с субминимизацией критерия качества (2).

Пример

Рассмотрим мультиагентную систему, математическая модель которой имеет вид

x i

(t)



O31 a0i

a1i

I3 a2i

a3i

  

xi

(t )



O31

 

r0i

  

ui

(t

)



O31 

 

d0i

 

fi (t)



  0i

1i

O34 2i

3i

  

O31

 

n0i

  



  

s0i

s1i

O34 s2i



s3i

  

x

j

(t

),

(14)

yi (t)  1 0 0 0xi (t), i, j  1, 2, i  j,

где Oij – матрица размерности ij с нулевыми элементами. Класс неопределенности  задан неравенствами: |ali| ≤ 10, l = 0, 1, 2, 3, i = 1, 2, 1 ≤ r0i ≤ 4, |d0i| ≤ 10, |fi(t)| ≤ 10, |sli| ≤ 10, j = 1, 2. Предполагаются известными начальные условия xi (0) = [1, 1, 1, 1]T.
Цель управления – квазиминимизация интегрального критерия качества (2) и ограниченность всех сигналов в системе управления. Зададим следующие параметры в (2): qi  1, ri  1, tfi = 10 с, yi (0) = 1 и
yi (10) = 2. Сформируем уравнение номинального объекта управления (4) в виде

x i

(t

)



O31

 

1

4

I3 6

 4

xi

(t

)



O31

 

1

  

ui

(t

)

,

yNi (t)  1, 0, 0, 0 xi (t) .

Для (15) перепишем критерий (2) и сформируем оптимальное управление в виде

(15)

10
  Ji  xTi (t)diag1, 0, 0, 0 x(t)  u02i (t) dt, 0

   u0i (t)  0, 0, 0, 1 z22,i (t)z121,i (t)xi (t)  z21,i (t)  z22,i (t)z121,i (t)z11,i (t) xi (10) .

Введем вспомогательный контур (7), где xi (10) = [2, 2, 2, 2]T и i = 0,04. Тогда

 xi

(t

)



A0i

(t)xi

(t)



1 



0

0 O34

0 

z21,i (t)  z22,i (t)z121,i (t)z11,i (t)

xi (10) 



 0, 040, 0, 0, 1T ui (t), yi (t)  1, 0, 0, 0 xi (t), xi (0)  1, 1, 1, 1T .
Пусть в (11) Di = [20, 150, 500, 625]T, µ = 0,01. В результате наблюдатель определится в виде
1i (t)  2i (t)  2 103 1i (t)  i (t),  2i (t)  3i (t) 1,5 106 2i (t)  i (t) ,  3i (t)  4i (t)  5 108 3i (t)  i (t) ,  4i (t)  6, 25 1010 4i (t)  i (t), i (0)  0.
Используя наблюдатель (16), сигнал компенсации (10) можно записать в

(16) виде

 ui (t)  25a04,i (t)i (t) , где a04,i (t)  1  4  6  4  z4,i (t) , a04,i (t) и z4,i (t) – четвертые строки

матриц A0i(t) и z22,i (t)z121,i (t) соответственно.
На рисунке, а, приведены результаты моделирования по выходам первой подсистемы (14) и номинального объекта (15), на рисунке, б, – результаты моделирования по выходам второй подсистемы (14) и номинального объекта (15) при следующих данных:

 в первой подсистеме: a31  8  sin t , a21  6  cos t , a11  9  sin 2t , a01  8  2 cos 3t , r01  6 ,

 d01  2  2sin t , 31  1 sin y1  sin t , 21  cos y1 , 11  1 ln 1 y1 , 01  sin 2 y1 , n01  1 sin t ,

s31  5  sin t , s21  7 , s11  3 , s01  15 , f1(t)  2  sin 0,8t ;

Научно-технический вестник информационных технологий, механики и оптики, 2013, № 1 (83)

21

СУБОПТИМАЛЬНОЕ УПРАВЛЕНИЕ НЕЛИНЕЙНЫМИ МУЛЬТИАГЕНТНЫМИ …

 во второй подсистеме: a32  2  sin t , a22  6  cos t , a12  8  2sin t , a02  5  cos 3t , r02  5 ,

d02  5  2 sin 2t ,

32  2  sin 2 y2 ,

22  cos y2 ,

 12  2  ln 3  y2  sin t ,

02  cos 2 y2 ,

n02  1 3sin t , s32  15 , s22  9  sin t , s12  9  cos t , s02  10  cos 2t , f2 (t)  1 cos1, 2t .

3,5 3

y1(t)

3,5 3

2,5 2,5 y2(t)

22

1,5 1

yN(t)

1,5 1

yN(t)

0,5 0,5

0 2 4 6 8 t, c

0 2 4 6 8 t, c

аб Рисунок. Результаты моделирования: по y1(t) и yN (t) (а); по y2 (t) и yN (t) (б)

Заключение

В работе рассмотрена схема децентрализованного робастного субоптимального управления нелинейными мультиагентными системами. При решении предполагалось, что измерению доступны только скалярные выходы локальных подсистем и запрещен обмен информации между ними. Для выделения неизвестных возмущений и обеспечения субоптимального управления предлагалось ввести вспомогательный контур параллельно объекту. Далее выделенные возмущения оценивались и компенсировались с заданной точностью за конечное время. Результаты аналитических выводов были подтверждены численным моделированием.

Приложение

Доказательство утверждения. Рассмотрим новую переменную i (t)  Rni , равную разности фа-
зовых переменных (13) и (4), причем на вход номинального объекта (4) подано оптимальное управление (5). В результате получим

i (t)  ANii (t)  i1ni 1bigi i (t), i (0)  0 .

Преобразуем последнее уравнение и уравнение (12) к виду

i (t)



ANi



i

(t

)





ni 2

1bi

g

i



i

(t

),

1 i (t)  Gi i (t)  2bi i (t),

(П.1)

где µ1 = µ2 = µ. Воспользуемся первой леммой [9], согласно которой рассмотрим систему (П.1) при µ2 = 0. Так как собственные числа матрицы ANi не лежат в правой полуплоскости комплексной плоскости

(предположение 2) и Gi гурвицева, то решение (П.1) при 2 = 0 глобально устойчиво. Значит, согласно [9], i (t), i (t), i (t) и  i (t) ограничены. Доказательство ограниченности остальных функций аналогично

[5]. В соответствии с леммой [9] система (П.1) диссипативна. Значит, sup  i (t)  k1 , sup i (t)  k2 , tt

k1 < , k2 < . Однако диссипативность (П.1) не гарантирует ее асимптотическую устойчивость как сингулярно-возмущенной системы. Покажем, что при 2 > 0 обеспечивается малость величины |i (t)|. Выберем функцию Ляпунова в виде

V  Ti (t)Pii (t)  Ti (t)Hii (t) ,

(П.2)

где Pi  PiT  0 , Hi  HTi  0 , и вычислим полную производную от нее вдоль траекторий (П.1) при

µ1 = µ2 = µ0:

V



Ti

(t)Q1ii (t)



20ni

1 T i

(t)Pibigii (t)

 01Ti

(t)Q2i i (t)



20 Ti

(t)Hibi i (t)

.

(П.3)

Здесь ATNi Pi  Pi ANi  Q1i , GTi Hi  HiGi  Q2i , Q1i  Q1Ti  0 , Q2i  QT2i  0 . Оценим в (П.3) второе и четвертое слагаемые:

 2

ni 0

1 T i

(t)Pibigi i

(t)



2

ni 0

1 T i

(t )Pi bi g i

Pi bi gi

T

i (t)



2

ni 0

1k

2 2

;

20Ti (t)Hibi i (t)  20Ti (t)HibibTi Hi i (t)  20k12. Воспользовавшись оценками, перепишем (П.3): V  Ti (t)Q3ii (t)  Ti (t)Q4i i (t)  i , где

   Q3i

 Q1i



2

ni 0

1Pi

bi

g

i

Pibigii T ,

Q4i



Q2i





2 0

Hi

bi

bTi

H

i

,

i  20

k12



ni 0



2

k22

. Очевидно, что всегда

22 Научно-технический вестник информационных технологий, механики и оптики,
2013, № 1 (83)

И.Б. Фуртат

существует число 0  0 , обеспечивающее Q3i  0 и Q4i  0 . Оценим производную функции Ляпунова

в

виде

V  iV  i ,

где

i



min

  

min (Q3i ) max (Pi )

,

min (Q4i max (Hi

) )

  

.

Решив

последнее

неравенство,

получим

     V



eitV

(0)





1 i

1  eit

i . Тогда в силу структуры (П.2)

εi (t) 2  min (Pi ) eitV (0)  1  eit

i1i

для t  [0, tfi], причем значение правой части последнего неравенства зависит от величины µ0. Очевидно, что уменьшением числа µ0 можно уменьшить значение |i (t)|, а значит, уменьшить погрешность, возникающую при субминимизации критерия (2), что подтверждено результатами моделирования.

Литература

1. Методы классической и современной теории автоматического управления. Теория оптимизации автоматического управления / Под ред. К.А. Пупкова и Н.Д. Егупова. – М.: Издательство МГТУ им. Н.Э. Баумана. – 2004. – Т. 4. – 744 с.
2. Буков В.Н. Вложение систем. Аналитический подход к анализу и синтезу матричных систем. – Калуга: Издательство научной литературы Н.Ф. Бочкаревой, 2006. – 720 с.
3. Никифоров В.О. Адаптивное и робастное управление с компенсацией возмущений. – СПб: Наука, 2003. – 282 с.
4. Бобцов А.А. Алгоритм робастного управления неопределенным объектом без измерения производных регулируемой переменной // Автоматика и телемеханика. – 2003. – № 8. – С. 82–96.
5. Фуртат И.Б. Робастное субоптимальное управление линейными нестационарными объектами по выходу // Мехатроника, автоматизация, управление. – 2009. – № 7. – С. 7–12.
6. Цыкунов А.М. Алгоритмы робастного управления с компенсацией ограниченных возмущений // Автоматика и телемеханика. – 2007. – № 7. – С. 103–115.
7. Теория автоматического управления. Ч. 2. Теория нелинейных и специальных систем автоматического управления / Под ред. А.А. Воронова. – М.: Высшая школа, 1986. – 504 с.
8. Atassi A.N., Khalil H.K. A separation principle for the stabilization of class of nonlinear systems // IEEE Trans. Automat. Control. – 1999. – V. 44. – № 9. – P. 1672–1687.
9. Брусин В.А. Об одном классе сингулярно возмущенных адаптивных систем. 1 // Автоматика и телемеханика. – 1995. – № 4. – С. 119–127.

Фуртат Игорь Борисович

– Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, кандидат технических наук, доцент, cainenash@mail.ru

Научно-технический вестник информационных технологий, механики и оптики, 2013, № 1 (83)

23