ЭРЕДИТАРНАЯ МОДЕЛЬ ИНЕРЦИОННОГО ЗАПАЗДЫВАНИЯ В ЗАДАЧЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
Эредитарная модель инерционного запаздывания в задаче оптимального управления
27
УДК 62.50
Д. А. МУЗЫКА, Р. О. ПЕЩЕРОВ, В. Ю. ТЕРТЫЧНЫЙ-ДАУРИ
ЭРЕДИТАРНАЯ МОДЕЛЬ ИНЕРЦИОННОГО ЗАПАЗДЫВАНИЯ В ЗАДАЧЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ*
С использованием уравнений Вольтерра с переменными пределами интегрирования (интегральной эредитарной процедуры запаздывания) рассмотрена организация процесса запаздывания по времени в канале управления динамическим объектом. Представлена интегральная формула, позволяющая задавать закон управления с запаздыванием по времени, ее вывод обеспечивается с помощью итерационного приближения в схеме интегрального уравнения Вольтерра второго рода.
Ключевые слова: эредитарность, запаздывание по времени в управлении, уравнения Вольтерра, итерационная аппроксимация, интегральные преобразования.
Введение. Формирование блока запаздывания (БЗ), т.е. некоторого устройства, призванного имитировать подачу на вход объекта управления управляющих воздействий с запаз-
дыванием по времени u (t − h) , h > 0 , t ∈[t0,t1] , основано на реальных, а не абстрактных тех-
нических возможностях моделируемых управляемых динамических систем. Инерционное запаздывание по времени (в зависимости от типа системы управления) является внутренней характеристикой этой системы.
Отметим, что БЗ может функционировать исходя из различных принципов и условий (см., например, работы [1—3]). При этом требуется наиболее эффективно математическими средствами реализовать (или смоделировать) задержку по времени в канале обратной связи.
Термином „эредитарность“ В. Вольтерра [4, 5] обозначал такие явления в динамических процессах, которым в той или иной мере свойственны наследственность, наличие „памяти“ от прошлого состояния системы (гистерезис, запаздывание). В работах [4, 5] была предложена теория интегральных и интегродифференциальных уравнений с переменным пределом интегрирования.
Согласно работе академика Н.Н. Лузина [6] „…«Феномен запаздывания» … являет собою удержание следов прошлого состояния, … это означает, что здесь применим не аппарат дифференциальных уравнений, каковы бы они не были, но интегродифференциальные уравнения Вольтерра“.
Рассмотрим решение задачи эредитарного моделирования по времени в канале управления движением динамического объекта, обосновав возможность применения итерационных процедур приближенного решения интегральных уравнений Вольтерра к задачам управления с запаздыванием.
У u(t) БЗ u(t–h) ОУ x(t)
x(t) Рис. 1
В соответствии с рис. 1 (У — управление, ОУ — объект управления, h > 0 — запазды-
вание по времени) осуществляется вывод формулы для выбора закона управления u (t ) при
* Исследование выполнено при поддержке Министерства образования и науки Российской Федерации (соглашение № 14.В37.21.1928).
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2013. Т. 56, № 4
28 Д. А. Музыка, Р. О. Пещеров, В. Ю. Тертычный-Даури
помощи блока запаздывания, с учетом того, что формула для закона управления с запаздыва-
нием по времени u (t − h) в функции вектора состояния x (t ) уже получена.
Постановка задачи. Основные допущения. На основе уравнений Вольтерра сформи-
руем БЗ в управлении по времени, на вход которого подается сигнал управления u (t ) , а на
выходе образуется u (t − h) , h > 0 , t ∈[t0,t1] .
Будем считать далее, что ядро интегрального уравнения для БЗ, описывающее эффект эредитарности, представляет собой функцию разности t − s , где s — переменная интегриро-
вания по времени. Положим это ядро равным exp ⎡⎣−α (t − s)⎦⎤ , где α > 0 — некоторая задан-
ная постоянная. Наличие такого ядра обеспечивает затухание эредитарности с ростом запаздывания по времени.
Важной особенностью формируемого БЗ с эредитарными свойствами служит его прямая
зависимость от задачи минимизации исходного функционала качества: J → min ( u (t − h) — u∈U
управление с запаздыванием по времени, U — допустимое множество управлений).
Выбор оптимального закона управления u0 (t − h) как решения соответствующего оп-
тимизационного уравнения Беллмана означает о том, что u0 (t − h) представляет собой неко-
торую известную (найденную) вектор-функцию ω текущего состояния x (t ) системы и вре-
мени t [7, 8]:
u0 (t − h) = ω ⎡⎣x (t ),t⎤⎦ .
(1)
Будем считать u (t − h) известной вектор-функцией x (t ) и t , определяемой по формуле
(1), а u (t ) — неизвестной вектор-функцией x (t ) и t , а также величины запаздывания h .
Схема решения. Уравнения Вольтерра. Основное уравнение, описывающее работу БЗ, зададим в виде интегрального уравнения Вольтерра второго рода относительно уравнения
u (t ) с переменными пределами интегрирования
t
Ω (t ) = u (t ) + ∫ e−α(t−s)u (s) ds, α, h > 0 ,
(2)
t−h
где заданные величины α, h > 0 считаются постоянными, а вектор-функции Ω и u — непре-
рывно дифференцируемыми по t .
Продифференцируем уравнение (2), пользуясь формулой дифференцирования интеграла с переменными пределами интегрирования:
d dt
t
∫
t−h
f
(s) ds
=
d ds
⎡t
⎢∫
⎣⎢ c
f
(s) ds
+
c
∫
t−h
f
⎤
(s) ds⎥
⎥⎦
=
=
f
(t ) −
d dt
t−h
∫
c
f
(s) ds =
f
(t ) −
f
(t − h),
∀c = const ∈ (t − h,t ) . Для уравнения (2) после дифференцирования по t имеем
t
∫Ω (t ) = u (t ) + e−αt eαsu ( s) ds + e−αt ⎢⎣⎡eαtu (t ) − eα(t−h)u (t − h)⎥⎦⎤ , t−h
откуда следует
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2013. Т. 56, № 4
Эредитарная модель инерционного запаздывания в задаче оптимального управления
29
t
Ω (t ) = u (t ) + u (t ) − α ∫ e−α(t−s)u ( s) ds − e−αhu (t − h) .
(3)
t−h
По сравнению с уравнением (2) преимущество интегродифференциального уравнения
Вольтерра первого порядка (3) относительно неизвестной вектор-функции управления u (t )
заключается в том, что в него явно входит управление с запаздыванием по времени u (t − h) .
Путем интегрирования уравнение (3) сводится к (2). Отметим, что u (t ) = Ω(t ) при h = 0 ,
следовательно
u0 (t − h) h=0 = u0 (t ) = ω⎣⎡x(t ),t⎦⎤ .
В этом случае приходим к известному решению (в виде управления) без запаздывания (1). Таким образом, надо положить
Ω(t ) = ω⎣⎡x (t ),t⎦⎤ ≡ ω(t ) ,
тогда уравнения (2), (3) запишутся в соответствующем виде при Ω (t ) = ω(t ) .
С учетом закона оптимального управления (1) уравнение (3) можно представить следующим образом:
t
ω(t ) + e−αhω(t ) = u (t ) + u (t ) − α ∫ e−α(t−s)u (s) ds . t−h
При h = 0 имеем линейно-дифференциальное уравнение
(4)
ω(t)+ω(t) = u(t)+u(t)
с решением
u (t ) − ω(t ) = Ce−(t−t0 ) , t ∈[t0,t1] .
Чтобы u (t ) = ω(t ) , как и в уравнении (2) при h = 0 , следует положить
u (t0 ) − ω(t0 ) = C = 0 .
Итерационная аппроксимация. Очевидно, что интегральное уравнение (2) имеет более простую структуру, чем интегродифференциальные (3) или (4), рассмотрим его при
Ω (t ) = ω(t ) . Разрешим (2) относительно u (t ) , пользуясь итерационным подходом. Будем
считать, что оно порождено системой n линейных алгебраических уравнений с n неизвест-
ными
i−1
∑ui + Kirur = ωi , i = 1, n ,
(5)
r=i−2
при u−1 + u0 = 0 (i = 1, 2) . Здесь дискретный индекс i заменим на t , а r — на s ;
K (t, s) = e−α(t−s) = Kts .
Обозначим через ∆ определитель из коэффициентов системы (5):
u1 = ω1,
u2 = K21u1 = ω2 ,
u3 + K31u1 + K32u2 = ω3,
u4 + K42u2 + K43u3 = ω4, ,
.......................................
un + Kn(n−2)un−2 + Kn(n−1)un−1 = ωn ,
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2013. Т. 56, № 4
30 Д. А. Музыка, Р. О. Пещеров, В. Ю. Тертычный-Даури
тогда получим
1 0 0 0 0 ...
0
K21 1 0 0 0 ... K31 K32 1 0 0 ... ∆ = 0 K42 K43 1 0 ... 0 0 K53 K54 1 ...
i i i i i ...
0 0 0 =1, 0 i
0 0 0 0 i ... Kn(n−2)Kn(n−1)1
причем, если ∆ir = 0 — алгебраическое дополнение для элемента Kir , то
∆ir = 0 (i > r ) , ∆rr = 1.
Пользуясь правилом Крамера, можем написать для неизвестных ur :
r−1 r−1
∑ ∑ur = ωr +
∆irωi = ωr +
Sriωi , r = 1, n ,
i=r−2
i=r−2
(6)
где ω−1 = ω0 = 0 (r = 1, 2) ; Sri = ∆ir .
Данный итерационный прием можно применить для исходного интегрального уравне-
ния (2). Тогда его решение u (t ) при переходе от конечного числа переменных к бесконечно-
му получим из соотношения (6) в виде интегрального равенства
t
u (t) = ω(t ) + ∫ S (t, s)ω(s) ds , t−h
где S (t, s) — разрешающее ядро уравнения (2).
(7)
Интегральные преобразования. Требуется с помощью итерационного приближения
найти решение (7), для обоснования которого подставим выражение (6) в уравнение (5):
∑ ∑ ∑ωi
+
i−1
Sik ωk
k =i−2
+
i−1
wk
k =i−2
⎛ ⎝⎜⎜
Kik
+
i−1
Kir Srk
r =k +1
⎞ ⎟⎠⎟
=
ωi
.
После сокращения на ωi придем к равенствам
i−1
∑Sik + Kik +
Kir Srk = 0 ,
(8)
r=k +1
откуда при переходе от конечного числа переменных к бесконечному с учетом изменения ин-
декса k получим:
s−h s−h
∫ K (t,ξ) S (ξ, s) ds = ∫ S (t,ξ) K (ξ, s) dξ = S (t, s) + K (t, s) .
ss
Заменив t на ξ , умножим уравнение (2)
(9)
ξ
u (ξ) + ∫ K (ξ, s)u (s) ds = ω(ξ) ξ−h
( )K (ξ, s) = e−α(ξ−s), α > 0 на S (t,ξ) и проинтегрируем результат по ξ от t − h до t :
t tξ
t
∫ S (t,ξ)u (ξ) dξ + ∫ S (t,ξ) dξ ∫ K (ξ, s)u (s) ds = ∫ S (t,ξ)ω(ξ) dξ .
t−h t−h ξ−h
t−h
(10)
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2013. Т. 56, № 4
Эредитарная модель инерционного запаздывания в задаче оптимального управления
31
В предположении, что S (t, s) , K (t, s) — это скалярные функции, домножим на u (s)
соотношение (9) и проинтегрируем по s от t − h до t :
ts
t
∫ u (s) ds ∫ K (t,ξ) S (ξ, s) dξ = − ∫ ⎡⎣S (t, s) + K (t, s)⎤⎦ u (s) ds .
(11)
t−h s−h
t−h
Обобщим формулу Дирихле на двойные интегралы с переменными верхними и нижни-
ми пределами интегрирования:
bs
bb
∫ ds∫ f (s,ξ) dξ = ∫ dξ∫ f (s,ξ) ds ,
aa
aξ
где a, b — фиксированные числа.
(12)
В этой связи для всякой непрерывной по своим аргументам функции f ( s, ξ) можно до-
казать следующее равенство (ср. с равенством (12)):
bs
bξ
∫ ds ∫ f (s,ξ) dξ = ∫ dξ ∫ f (ξ, s) ds ,
(13)
a s−h
a ξ−h
где h = const > 0 .
В отличие от формулы изменения порядка интегрирования (12), когда области интегри-
рования слева ( ∆1 ) и справа ( ∆2 ) одинаковы, в (13) области ∆1 и ∆2 различны, но симмет-
ричны относительно оси ξ = s и имеют одинаковые площади, что обеспечивает равенство
повторных интегралов слева и справа (рис. 2).
ξ
ξ=s+h
ξ=s
b ∆2
a
h
ξ=s–h ∆1
0s
–h
Рис. 2
Для обоснования равенства (13) можно использовать и такой аргумент: поменяв в левой
части местами переменные s и ξ , получим его правую часть.
Воспользуемся далее равенством (13) в соотношении (10), которое можно переписать в виде
t ts
t
∫ S (t,ξ)u (ξ) dξ + ∫ u (s) ds ∫ K (t,ξ) S (ξ, s) dξ = ∫ S (t,ξ)ω(ξ) dξ ,
t−h t−h s−h
t−h
или, принимая во внимание выражение (11):
t t tt
∫ S (t,ξ)u (ξ) dξ − ∫ K (t, s)u (s) ds − ∫ S (t, s)u (s) ds = ∫ S (t,ξ)ω(ξ) dξ .
t−h t−h t−h t−h
(14)
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2013. Т. 56, № 4
32 Д. А. Музыка, Р. О. Пещеров, В. Ю. Тертычный-Даури
Сократив слева первое и третье слагаемые в (14), получим интегральную формулу
tt
− ∫ K (t, s)u (s) ds = ∫ S (t,ξ)ω(ξ) dξ t−h t−h
с взаимным ядром S (t, s) , разрешающую уравнение (2).
Процедура вычисления ядерных функций. Опишем процедуру для вычисления опре-
делителей Sik = δki , а тем самым и ядерных функций S (t, s) , в соотношении (7). Для этого
вернемся к равенствам (8). Будем считать, что
Sik = Ki(k1) + Ki(k2) + ... + Ki(kl) , где Ki(kl) — слагаемое порядка l ; l — некоторое заданное натуральное число. Запишем соотношения (8) в виде
∑ ( )Ki(k1) + Ki(k2) + ... + Ki(kl) + Kik +
Kir
K
(1)
rk
+
K
(2)
rk
+
... +
K r(kl −1)
=0
r=k +1
(15)
и положим в выражении (15):
∑ ∑ ∑K1(k1) = −Kik , Ki(k2) = i−1 Ki(k1)Kr(1k) , Ki(k3) = i−1 Ki(r1)Kr(k2) , … , Ki(kl) = i−1 Ki(r1)Kr(kl−1) .
r=k +1
r=k +1
r=k +1
Чтобы отсюда найти S (t, s) , перейдем от конечного числа переменных к бесконечному
на промежутке ξ ∈[s,t] :
K (1) (t, s) = −K (t, s),
K
(2)
(t,
s)
=
t
∫
K
(1)
(t,
ξ)
K
(1)
(ξ,
s)
d ξ,
s
t
K (3) (t, s) = ∫ K (1) (t, ξ) K (2) (ξ, s) dξ,
s
.........................................................
где s ∈[t − h,t] и
t
K (l) (t, s) = ∫ K (1) (t, ξ) K (l−1) (ξ, s) dξ, s
S
(
t,
s
)
=
∞
∑
K
(l
)
(
t
,
s
),
lim K (l) (t, s) = 0 .
l=1 l→∞
Вследствие ограниченности функции K (t, s) : K (1) (t, s) ≤ M = const ∀t, s , а также вы-
текающих при интегрировании неравенств
K (1) (t, s) ≤ M ,
K (2)
(t, s)
≤
M
2 t−s 1!
,
…,
K (l )
(t, s)
≤
M l t − s l−1
(l −1)!
приведенный ряд для S (t, s) равномерно сходится.
Заключение. В настоящей статье предложена схема формирования блока запаздывания по времени в канале управляющего воздействия, основанная на использовании интегральных и интегродифференциальных уравнений Вольтерра с переменными пределами интегрирова-
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2013. Т. 56, № 4
Эредитарная модель инерционного запаздывания в задаче оптимального управления
33
ния. Для соответствующего интегрального уравнения Вольтерра приведена итерационная процедура решения и получена формула для формирования управления в зависимости от величины запаздывания. По мнению авторов, эредитарная модель построения БЗ представляется наиболее естественной и эффективной при синтезе закона управления с запаздыванием по времени, основанного на беллмановской процедуре оптимизации. Эта процедура предполага-
ет формирование в БЗ сначала u0 (t − h) (1), а затем u0 (t ) по формуле (7), а не наоборот, как
это обычно имеет место при неоптимизационном синтезе: u (t ) → u (t − h) . Для исходного
интегрального уравнения Вольтерра второго рода с двумя переменными пределами интегрирования применительно к задаче управления с запаздыванием по времени введена интегральная формула решения с помощью итеративной приближенной процедуры решения, которая обобщается на случай перехода от конечного числа переменных к бесконечному.
СПИСОК ЛИТЕРАТУРЫ
1. Колмановский В. Б., Носов В. Р. Устойчивость и периодические режимы регулируемых систем с последействием. М.: Наука, 1981. 448 с.
2. Бобцов А. А. Адаптивное и робастное управление неопределенными системами по выходу. СПб: Наука, 2011. 174 с.
3. Пыркин А. А. Управление в условиях запаздывания // Науч.-техн. вестн. СПбГУ ИТМО. 2007. Вып. 38. С. 287—292.
4. Вольтерра В. Теория функционалов, интегральных и интегродифференциальных уравнений. М.: Наука, 1982. 304 с.
5. Вольтерра В. Математическая теория борьбы за существование. М.: Наука, 1976. 286 с.
6. Лузин Н. Н. К изучению матричной теории дифференциальных уравнений // АиТ. 1940. № 5. С. 4—66.
7. Тертычный-Даури В. Ю. Галамех. Т. 4. Оптимальная механика. М.: Изд-во физ.-мат. лит., 2008. 608 с.
8. Тертычный-Даури В. Ю. Условная задача оптимального управления: адаптивный метод решения // АиТ. 2006. № 3. C. 54—67.
Дмитрий Александрович Музыка Руслан Олегович Пещеров Владимир Юрьевич Тертычный-Даури
Сведения об авторах — студент; Санкт-Петербургский национальный исследователь-
ский университет информационных технологий, механики и оптики, кафедра систем управления и информатики; E-mail: 146038@niuitmo.ru — студент; Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, кафедра систем управления и информатики; E-mail: rpeshcherov@mail.ru — д-р физ.-мат. наук, профессор; Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, кафедра высшей математики, кафедра систем управления и информатики; E-mail: tertychny-dauri@mail.ru
Рекомендована кафедрой систем управления и информатики
Поступила в редакцию 13.12.12 г.
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2013. Т. 56, № 4
27
УДК 62.50
Д. А. МУЗЫКА, Р. О. ПЕЩЕРОВ, В. Ю. ТЕРТЫЧНЫЙ-ДАУРИ
ЭРЕДИТАРНАЯ МОДЕЛЬ ИНЕРЦИОННОГО ЗАПАЗДЫВАНИЯ В ЗАДАЧЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ*
С использованием уравнений Вольтерра с переменными пределами интегрирования (интегральной эредитарной процедуры запаздывания) рассмотрена организация процесса запаздывания по времени в канале управления динамическим объектом. Представлена интегральная формула, позволяющая задавать закон управления с запаздыванием по времени, ее вывод обеспечивается с помощью итерационного приближения в схеме интегрального уравнения Вольтерра второго рода.
Ключевые слова: эредитарность, запаздывание по времени в управлении, уравнения Вольтерра, итерационная аппроксимация, интегральные преобразования.
Введение. Формирование блока запаздывания (БЗ), т.е. некоторого устройства, призванного имитировать подачу на вход объекта управления управляющих воздействий с запаз-
дыванием по времени u (t − h) , h > 0 , t ∈[t0,t1] , основано на реальных, а не абстрактных тех-
нических возможностях моделируемых управляемых динамических систем. Инерционное запаздывание по времени (в зависимости от типа системы управления) является внутренней характеристикой этой системы.
Отметим, что БЗ может функционировать исходя из различных принципов и условий (см., например, работы [1—3]). При этом требуется наиболее эффективно математическими средствами реализовать (или смоделировать) задержку по времени в канале обратной связи.
Термином „эредитарность“ В. Вольтерра [4, 5] обозначал такие явления в динамических процессах, которым в той или иной мере свойственны наследственность, наличие „памяти“ от прошлого состояния системы (гистерезис, запаздывание). В работах [4, 5] была предложена теория интегральных и интегродифференциальных уравнений с переменным пределом интегрирования.
Согласно работе академика Н.Н. Лузина [6] „…«Феномен запаздывания» … являет собою удержание следов прошлого состояния, … это означает, что здесь применим не аппарат дифференциальных уравнений, каковы бы они не были, но интегродифференциальные уравнения Вольтерра“.
Рассмотрим решение задачи эредитарного моделирования по времени в канале управления движением динамического объекта, обосновав возможность применения итерационных процедур приближенного решения интегральных уравнений Вольтерра к задачам управления с запаздыванием.
У u(t) БЗ u(t–h) ОУ x(t)
x(t) Рис. 1
В соответствии с рис. 1 (У — управление, ОУ — объект управления, h > 0 — запазды-
вание по времени) осуществляется вывод формулы для выбора закона управления u (t ) при
* Исследование выполнено при поддержке Министерства образования и науки Российской Федерации (соглашение № 14.В37.21.1928).
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2013. Т. 56, № 4
28 Д. А. Музыка, Р. О. Пещеров, В. Ю. Тертычный-Даури
помощи блока запаздывания, с учетом того, что формула для закона управления с запаздыва-
нием по времени u (t − h) в функции вектора состояния x (t ) уже получена.
Постановка задачи. Основные допущения. На основе уравнений Вольтерра сформи-
руем БЗ в управлении по времени, на вход которого подается сигнал управления u (t ) , а на
выходе образуется u (t − h) , h > 0 , t ∈[t0,t1] .
Будем считать далее, что ядро интегрального уравнения для БЗ, описывающее эффект эредитарности, представляет собой функцию разности t − s , где s — переменная интегриро-
вания по времени. Положим это ядро равным exp ⎡⎣−α (t − s)⎦⎤ , где α > 0 — некоторая задан-
ная постоянная. Наличие такого ядра обеспечивает затухание эредитарности с ростом запаздывания по времени.
Важной особенностью формируемого БЗ с эредитарными свойствами служит его прямая
зависимость от задачи минимизации исходного функционала качества: J → min ( u (t − h) — u∈U
управление с запаздыванием по времени, U — допустимое множество управлений).
Выбор оптимального закона управления u0 (t − h) как решения соответствующего оп-
тимизационного уравнения Беллмана означает о том, что u0 (t − h) представляет собой неко-
торую известную (найденную) вектор-функцию ω текущего состояния x (t ) системы и вре-
мени t [7, 8]:
u0 (t − h) = ω ⎡⎣x (t ),t⎤⎦ .
(1)
Будем считать u (t − h) известной вектор-функцией x (t ) и t , определяемой по формуле
(1), а u (t ) — неизвестной вектор-функцией x (t ) и t , а также величины запаздывания h .
Схема решения. Уравнения Вольтерра. Основное уравнение, описывающее работу БЗ, зададим в виде интегрального уравнения Вольтерра второго рода относительно уравнения
u (t ) с переменными пределами интегрирования
t
Ω (t ) = u (t ) + ∫ e−α(t−s)u (s) ds, α, h > 0 ,
(2)
t−h
где заданные величины α, h > 0 считаются постоянными, а вектор-функции Ω и u — непре-
рывно дифференцируемыми по t .
Продифференцируем уравнение (2), пользуясь формулой дифференцирования интеграла с переменными пределами интегрирования:
d dt
t
∫
t−h
f
(s) ds
=
d ds
⎡t
⎢∫
⎣⎢ c
f
(s) ds
+
c
∫
t−h
f
⎤
(s) ds⎥
⎥⎦
=
=
f
(t ) −
d dt
t−h
∫
c
f
(s) ds =
f
(t ) −
f
(t − h),
∀c = const ∈ (t − h,t ) . Для уравнения (2) после дифференцирования по t имеем
t
∫Ω (t ) = u (t ) + e−αt eαsu ( s) ds + e−αt ⎢⎣⎡eαtu (t ) − eα(t−h)u (t − h)⎥⎦⎤ , t−h
откуда следует
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2013. Т. 56, № 4
Эредитарная модель инерционного запаздывания в задаче оптимального управления
29
t
Ω (t ) = u (t ) + u (t ) − α ∫ e−α(t−s)u ( s) ds − e−αhu (t − h) .
(3)
t−h
По сравнению с уравнением (2) преимущество интегродифференциального уравнения
Вольтерра первого порядка (3) относительно неизвестной вектор-функции управления u (t )
заключается в том, что в него явно входит управление с запаздыванием по времени u (t − h) .
Путем интегрирования уравнение (3) сводится к (2). Отметим, что u (t ) = Ω(t ) при h = 0 ,
следовательно
u0 (t − h) h=0 = u0 (t ) = ω⎣⎡x(t ),t⎦⎤ .
В этом случае приходим к известному решению (в виде управления) без запаздывания (1). Таким образом, надо положить
Ω(t ) = ω⎣⎡x (t ),t⎦⎤ ≡ ω(t ) ,
тогда уравнения (2), (3) запишутся в соответствующем виде при Ω (t ) = ω(t ) .
С учетом закона оптимального управления (1) уравнение (3) можно представить следующим образом:
t
ω(t ) + e−αhω(t ) = u (t ) + u (t ) − α ∫ e−α(t−s)u (s) ds . t−h
При h = 0 имеем линейно-дифференциальное уравнение
(4)
ω(t)+ω(t) = u(t)+u(t)
с решением
u (t ) − ω(t ) = Ce−(t−t0 ) , t ∈[t0,t1] .
Чтобы u (t ) = ω(t ) , как и в уравнении (2) при h = 0 , следует положить
u (t0 ) − ω(t0 ) = C = 0 .
Итерационная аппроксимация. Очевидно, что интегральное уравнение (2) имеет более простую структуру, чем интегродифференциальные (3) или (4), рассмотрим его при
Ω (t ) = ω(t ) . Разрешим (2) относительно u (t ) , пользуясь итерационным подходом. Будем
считать, что оно порождено системой n линейных алгебраических уравнений с n неизвест-
ными
i−1
∑ui + Kirur = ωi , i = 1, n ,
(5)
r=i−2
при u−1 + u0 = 0 (i = 1, 2) . Здесь дискретный индекс i заменим на t , а r — на s ;
K (t, s) = e−α(t−s) = Kts .
Обозначим через ∆ определитель из коэффициентов системы (5):
u1 = ω1,
u2 = K21u1 = ω2 ,
u3 + K31u1 + K32u2 = ω3,
u4 + K42u2 + K43u3 = ω4, ,
.......................................
un + Kn(n−2)un−2 + Kn(n−1)un−1 = ωn ,
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2013. Т. 56, № 4
30 Д. А. Музыка, Р. О. Пещеров, В. Ю. Тертычный-Даури
тогда получим
1 0 0 0 0 ...
0
K21 1 0 0 0 ... K31 K32 1 0 0 ... ∆ = 0 K42 K43 1 0 ... 0 0 K53 K54 1 ...
i i i i i ...
0 0 0 =1, 0 i
0 0 0 0 i ... Kn(n−2)Kn(n−1)1
причем, если ∆ir = 0 — алгебраическое дополнение для элемента Kir , то
∆ir = 0 (i > r ) , ∆rr = 1.
Пользуясь правилом Крамера, можем написать для неизвестных ur :
r−1 r−1
∑ ∑ur = ωr +
∆irωi = ωr +
Sriωi , r = 1, n ,
i=r−2
i=r−2
(6)
где ω−1 = ω0 = 0 (r = 1, 2) ; Sri = ∆ir .
Данный итерационный прием можно применить для исходного интегрального уравне-
ния (2). Тогда его решение u (t ) при переходе от конечного числа переменных к бесконечно-
му получим из соотношения (6) в виде интегрального равенства
t
u (t) = ω(t ) + ∫ S (t, s)ω(s) ds , t−h
где S (t, s) — разрешающее ядро уравнения (2).
(7)
Интегральные преобразования. Требуется с помощью итерационного приближения
найти решение (7), для обоснования которого подставим выражение (6) в уравнение (5):
∑ ∑ ∑ωi
+
i−1
Sik ωk
k =i−2
+
i−1
wk
k =i−2
⎛ ⎝⎜⎜
Kik
+
i−1
Kir Srk
r =k +1
⎞ ⎟⎠⎟
=
ωi
.
После сокращения на ωi придем к равенствам
i−1
∑Sik + Kik +
Kir Srk = 0 ,
(8)
r=k +1
откуда при переходе от конечного числа переменных к бесконечному с учетом изменения ин-
декса k получим:
s−h s−h
∫ K (t,ξ) S (ξ, s) ds = ∫ S (t,ξ) K (ξ, s) dξ = S (t, s) + K (t, s) .
ss
Заменив t на ξ , умножим уравнение (2)
(9)
ξ
u (ξ) + ∫ K (ξ, s)u (s) ds = ω(ξ) ξ−h
( )K (ξ, s) = e−α(ξ−s), α > 0 на S (t,ξ) и проинтегрируем результат по ξ от t − h до t :
t tξ
t
∫ S (t,ξ)u (ξ) dξ + ∫ S (t,ξ) dξ ∫ K (ξ, s)u (s) ds = ∫ S (t,ξ)ω(ξ) dξ .
t−h t−h ξ−h
t−h
(10)
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2013. Т. 56, № 4
Эредитарная модель инерционного запаздывания в задаче оптимального управления
31
В предположении, что S (t, s) , K (t, s) — это скалярные функции, домножим на u (s)
соотношение (9) и проинтегрируем по s от t − h до t :
ts
t
∫ u (s) ds ∫ K (t,ξ) S (ξ, s) dξ = − ∫ ⎡⎣S (t, s) + K (t, s)⎤⎦ u (s) ds .
(11)
t−h s−h
t−h
Обобщим формулу Дирихле на двойные интегралы с переменными верхними и нижни-
ми пределами интегрирования:
bs
bb
∫ ds∫ f (s,ξ) dξ = ∫ dξ∫ f (s,ξ) ds ,
aa
aξ
где a, b — фиксированные числа.
(12)
В этой связи для всякой непрерывной по своим аргументам функции f ( s, ξ) можно до-
казать следующее равенство (ср. с равенством (12)):
bs
bξ
∫ ds ∫ f (s,ξ) dξ = ∫ dξ ∫ f (ξ, s) ds ,
(13)
a s−h
a ξ−h
где h = const > 0 .
В отличие от формулы изменения порядка интегрирования (12), когда области интегри-
рования слева ( ∆1 ) и справа ( ∆2 ) одинаковы, в (13) области ∆1 и ∆2 различны, но симмет-
ричны относительно оси ξ = s и имеют одинаковые площади, что обеспечивает равенство
повторных интегралов слева и справа (рис. 2).
ξ
ξ=s+h
ξ=s
b ∆2
a
h
ξ=s–h ∆1
0s
–h
Рис. 2
Для обоснования равенства (13) можно использовать и такой аргумент: поменяв в левой
части местами переменные s и ξ , получим его правую часть.
Воспользуемся далее равенством (13) в соотношении (10), которое можно переписать в виде
t ts
t
∫ S (t,ξ)u (ξ) dξ + ∫ u (s) ds ∫ K (t,ξ) S (ξ, s) dξ = ∫ S (t,ξ)ω(ξ) dξ ,
t−h t−h s−h
t−h
или, принимая во внимание выражение (11):
t t tt
∫ S (t,ξ)u (ξ) dξ − ∫ K (t, s)u (s) ds − ∫ S (t, s)u (s) ds = ∫ S (t,ξ)ω(ξ) dξ .
t−h t−h t−h t−h
(14)
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2013. Т. 56, № 4
32 Д. А. Музыка, Р. О. Пещеров, В. Ю. Тертычный-Даури
Сократив слева первое и третье слагаемые в (14), получим интегральную формулу
tt
− ∫ K (t, s)u (s) ds = ∫ S (t,ξ)ω(ξ) dξ t−h t−h
с взаимным ядром S (t, s) , разрешающую уравнение (2).
Процедура вычисления ядерных функций. Опишем процедуру для вычисления опре-
делителей Sik = δki , а тем самым и ядерных функций S (t, s) , в соотношении (7). Для этого
вернемся к равенствам (8). Будем считать, что
Sik = Ki(k1) + Ki(k2) + ... + Ki(kl) , где Ki(kl) — слагаемое порядка l ; l — некоторое заданное натуральное число. Запишем соотношения (8) в виде
∑ ( )Ki(k1) + Ki(k2) + ... + Ki(kl) + Kik +
Kir
K
(1)
rk
+
K
(2)
rk
+
... +
K r(kl −1)
=0
r=k +1
(15)
и положим в выражении (15):
∑ ∑ ∑K1(k1) = −Kik , Ki(k2) = i−1 Ki(k1)Kr(1k) , Ki(k3) = i−1 Ki(r1)Kr(k2) , … , Ki(kl) = i−1 Ki(r1)Kr(kl−1) .
r=k +1
r=k +1
r=k +1
Чтобы отсюда найти S (t, s) , перейдем от конечного числа переменных к бесконечному
на промежутке ξ ∈[s,t] :
K (1) (t, s) = −K (t, s),
K
(2)
(t,
s)
=
t
∫
K
(1)
(t,
ξ)
K
(1)
(ξ,
s)
d ξ,
s
t
K (3) (t, s) = ∫ K (1) (t, ξ) K (2) (ξ, s) dξ,
s
.........................................................
где s ∈[t − h,t] и
t
K (l) (t, s) = ∫ K (1) (t, ξ) K (l−1) (ξ, s) dξ, s
S
(
t,
s
)
=
∞
∑
K
(l
)
(
t
,
s
),
lim K (l) (t, s) = 0 .
l=1 l→∞
Вследствие ограниченности функции K (t, s) : K (1) (t, s) ≤ M = const ∀t, s , а также вы-
текающих при интегрировании неравенств
K (1) (t, s) ≤ M ,
K (2)
(t, s)
≤
M
2 t−s 1!
,
…,
K (l )
(t, s)
≤
M l t − s l−1
(l −1)!
приведенный ряд для S (t, s) равномерно сходится.
Заключение. В настоящей статье предложена схема формирования блока запаздывания по времени в канале управляющего воздействия, основанная на использовании интегральных и интегродифференциальных уравнений Вольтерра с переменными пределами интегрирова-
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2013. Т. 56, № 4
Эредитарная модель инерционного запаздывания в задаче оптимального управления
33
ния. Для соответствующего интегрального уравнения Вольтерра приведена итерационная процедура решения и получена формула для формирования управления в зависимости от величины запаздывания. По мнению авторов, эредитарная модель построения БЗ представляется наиболее естественной и эффективной при синтезе закона управления с запаздыванием по времени, основанного на беллмановской процедуре оптимизации. Эта процедура предполага-
ет формирование в БЗ сначала u0 (t − h) (1), а затем u0 (t ) по формуле (7), а не наоборот, как
это обычно имеет место при неоптимизационном синтезе: u (t ) → u (t − h) . Для исходного
интегрального уравнения Вольтерра второго рода с двумя переменными пределами интегрирования применительно к задаче управления с запаздыванием по времени введена интегральная формула решения с помощью итеративной приближенной процедуры решения, которая обобщается на случай перехода от конечного числа переменных к бесконечному.
СПИСОК ЛИТЕРАТУРЫ
1. Колмановский В. Б., Носов В. Р. Устойчивость и периодические режимы регулируемых систем с последействием. М.: Наука, 1981. 448 с.
2. Бобцов А. А. Адаптивное и робастное управление неопределенными системами по выходу. СПб: Наука, 2011. 174 с.
3. Пыркин А. А. Управление в условиях запаздывания // Науч.-техн. вестн. СПбГУ ИТМО. 2007. Вып. 38. С. 287—292.
4. Вольтерра В. Теория функционалов, интегральных и интегродифференциальных уравнений. М.: Наука, 1982. 304 с.
5. Вольтерра В. Математическая теория борьбы за существование. М.: Наука, 1976. 286 с.
6. Лузин Н. Н. К изучению матричной теории дифференциальных уравнений // АиТ. 1940. № 5. С. 4—66.
7. Тертычный-Даури В. Ю. Галамех. Т. 4. Оптимальная механика. М.: Изд-во физ.-мат. лит., 2008. 608 с.
8. Тертычный-Даури В. Ю. Условная задача оптимального управления: адаптивный метод решения // АиТ. 2006. № 3. C. 54—67.
Дмитрий Александрович Музыка Руслан Олегович Пещеров Владимир Юрьевич Тертычный-Даури
Сведения об авторах — студент; Санкт-Петербургский национальный исследователь-
ский университет информационных технологий, механики и оптики, кафедра систем управления и информатики; E-mail: 146038@niuitmo.ru — студент; Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, кафедра систем управления и информатики; E-mail: rpeshcherov@mail.ru — д-р физ.-мат. наук, профессор; Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, кафедра высшей математики, кафедра систем управления и информатики; E-mail: tertychny-dauri@mail.ru
Рекомендована кафедрой систем управления и информатики
Поступила в редакцию 13.12.12 г.
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2013. Т. 56, № 4