Например, Бобцов

ЭРЕДИТАРНАЯ МОДЕЛЬ ИНЕРЦИОННОГО ЗАПАЗДЫВАНИЯ В ЗАДАЧЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

Эредитарная модель инерционного запаздывания в задаче оптимального управления

27

УДК 62.50

Д. А. МУЗЫКА, Р. О. ПЕЩЕРОВ, В. Ю. ТЕРТЫЧНЫЙ-ДАУРИ
ЭРЕДИТАРНАЯ МОДЕЛЬ ИНЕРЦИОННОГО ЗАПАЗДЫВАНИЯ В ЗАДАЧЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ*
С использованием уравнений Вольтерра с переменными пределами интегрирования (интегральной эредитарной процедуры запаздывания) рассмотрена организация процесса запаздывания по времени в канале управления динамическим объектом. Представлена интегральная формула, позволяющая задавать закон управления с запаздыванием по времени, ее вывод обеспечивается с помощью итерационного приближения в схеме интегрального уравнения Вольтерра второго рода.
Ключевые слова: эредитарность, запаздывание по времени в управлении, уравнения Вольтерра, итерационная аппроксимация, интегральные преобразования.
Введение. Формирование блока запаздывания (БЗ), т.е. некоторого устройства, призванного имитировать подачу на вход объекта управления управляющих воздействий с запаз-
дыванием по времени u (t − h) , h > 0 , t ∈[t0,t1] , основано на реальных, а не абстрактных тех-
нических возможностях моделируемых управляемых динамических систем. Инерционное запаздывание по времени (в зависимости от типа системы управления) является внутренней характеристикой этой системы.
Отметим, что БЗ может функционировать исходя из различных принципов и условий (см., например, работы [1—3]). При этом требуется наиболее эффективно математическими средствами реализовать (или смоделировать) задержку по времени в канале обратной связи.
Термином „эредитарность“ В. Вольтерра [4, 5] обозначал такие явления в динамических процессах, которым в той или иной мере свойственны наследственность, наличие „памяти“ от прошлого состояния системы (гистерезис, запаздывание). В работах [4, 5] была предложена теория интегральных и интегродифференциальных уравнений с переменным пределом интегрирования.
Согласно работе академика Н.Н. Лузина [6] „…«Феномен запаздывания» … являет собою удержание следов прошлого состояния, … это означает, что здесь применим не аппарат дифференциальных уравнений, каковы бы они не были, но интегродифференциальные уравнения Вольтерра“.
Рассмотрим решение задачи эредитарного моделирования по времени в канале управления движением динамического объекта, обосновав возможность применения итерационных процедур приближенного решения интегральных уравнений Вольтерра к задачам управления с запаздыванием.
У u(t) БЗ u(t–h) ОУ x(t)
x(t) Рис. 1
В соответствии с рис. 1 (У — управление, ОУ — объект управления, h > 0 — запазды-
вание по времени) осуществляется вывод формулы для выбора закона управления u (t ) при

* Исследование выполнено при поддержке Министерства образования и науки Российской Федерации (соглашение № 14.В37.21.1928).
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2013. Т. 56, № 4

28 Д. А. Музыка, Р. О. Пещеров, В. Ю. Тертычный-Даури

помощи блока запаздывания, с учетом того, что формула для закона управления с запаздыва-
нием по времени u (t − h) в функции вектора состояния x (t ) уже получена.

Постановка задачи. Основные допущения. На основе уравнений Вольтерра сформи-
руем БЗ в управлении по времени, на вход которого подается сигнал управления u (t ) , а на

выходе образуется u (t − h) , h > 0 , t ∈[t0,t1] .
Будем считать далее, что ядро интегрального уравнения для БЗ, описывающее эффект эредитарности, представляет собой функцию разности t − s , где s — переменная интегриро-
вания по времени. Положим это ядро равным exp ⎡⎣−α (t − s)⎦⎤ , где α > 0 — некоторая задан-
ная постоянная. Наличие такого ядра обеспечивает затухание эредитарности с ростом запаздывания по времени.
Важной особенностью формируемого БЗ с эредитарными свойствами служит его прямая
зависимость от задачи минимизации исходного функционала качества: J → min ( u (t − h) — u∈U
управление с запаздыванием по времени, U — допустимое множество управлений).
Выбор оптимального закона управления u0 (t − h) как решения соответствующего оп-

тимизационного уравнения Беллмана означает о том, что u0 (t − h) представляет собой неко-

торую известную (найденную) вектор-функцию ω текущего состояния x (t ) системы и вре-

мени t [7, 8]:

u0 (t − h) = ω ⎡⎣x (t ),t⎤⎦ .

(1)

Будем считать u (t − h) известной вектор-функцией x (t ) и t , определяемой по формуле

(1), а u (t ) — неизвестной вектор-функцией x (t ) и t , а также величины запаздывания h .

Схема решения. Уравнения Вольтерра. Основное уравнение, описывающее работу БЗ, зададим в виде интегрального уравнения Вольтерра второго рода относительно уравнения
u (t ) с переменными пределами интегрирования

t
Ω (t ) = u (t ) + ∫ e−α(t−s)u (s) ds, α, h > 0 ,

(2)

t−h

где заданные величины α, h > 0 считаются постоянными, а вектор-функции Ω и u — непре-

рывно дифференцируемыми по t .

Продифференцируем уравнение (2), пользуясь формулой дифференцирования интеграла с переменными пределами интегрирования:

d dt

t

t−h

f

(s) ds

=

d ds

⎡t
⎢∫
⎣⎢ c

f

(s) ds

+

c

t−h

f


(s) ds⎥
⎥⎦

=

=

f

(t ) −

d dt

t−h

c

f

(s) ds =

f

(t ) −

f

(t − h),

∀c = const ∈ (t − h,t ) . Для уравнения (2) после дифференцирования по t имеем

t
∫Ω (t ) = u (t ) + e−αt eαsu ( s) ds + e−αt ⎢⎣⎡eαtu (t ) − eα(t−h)u (t − h)⎥⎦⎤ , t−h
откуда следует

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2013. Т. 56, № 4

Эредитарная модель инерционного запаздывания в задаче оптимального управления

29

t
Ω (t ) = u (t ) + u (t ) − α ∫ e−α(t−s)u ( s) ds − e−αhu (t − h) .

(3)

t−h
По сравнению с уравнением (2) преимущество интегродифференциального уравнения

Вольтерра первого порядка (3) относительно неизвестной вектор-функции управления u (t )

заключается в том, что в него явно входит управление с запаздыванием по времени u (t − h) .

Путем интегрирования уравнение (3) сводится к (2). Отметим, что u (t ) = Ω(t ) при h = 0 ,

следовательно

u0 (t − h) h=0 = u0 (t ) = ω⎣⎡x(t ),t⎦⎤ .
В этом случае приходим к известному решению (в виде управления) без запаздывания (1). Таким образом, надо положить

Ω(t ) = ω⎣⎡x (t ),t⎦⎤ ≡ ω(t ) ,

тогда уравнения (2), (3) запишутся в соответствующем виде при Ω (t ) = ω(t ) .

С учетом закона оптимального управления (1) уравнение (3) можно представить следующим образом:

t
ω(t ) + e−αhω(t ) = u (t ) + u (t ) − α ∫ e−α(t−s)u (s) ds . t−h
При h = 0 имеем линейно-дифференциальное уравнение

(4)

ω(t)+ω(t) = u(t)+u(t)

с решением

u (t ) − ω(t ) = Ce−(t−t0 ) , t ∈[t0,t1] .

Чтобы u (t ) = ω(t ) , как и в уравнении (2) при h = 0 , следует положить

u (t0 ) − ω(t0 ) = C = 0 .
Итерационная аппроксимация. Очевидно, что интегральное уравнение (2) имеет более простую структуру, чем интегродифференциальные (3) или (4), рассмотрим его при
Ω (t ) = ω(t ) . Разрешим (2) относительно u (t ) , пользуясь итерационным подходом. Будем

считать, что оно порождено системой n линейных алгебраических уравнений с n неизвест-

ными

i−1
∑ui + Kirur = ωi , i = 1, n ,

(5)

r=i−2

при u−1 + u0 = 0 (i = 1, 2) . Здесь дискретный индекс i заменим на t , а r — на s ;

K (t, s) = e−α(t−s) = Kts .

Обозначим через ∆ определитель из коэффициентов системы (5):

u1 = ω1,

u2 = K21u1 = ω2 ,

u3 + K31u1 + K32u2 = ω3,

u4 + K42u2 + K43u3 = ω4, ,

.......................................

un + Kn(n−2)un−2 + Kn(n−1)un−1 = ωn ,

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2013. Т. 56, № 4

30 Д. А. Музыка, Р. О. Пещеров, В. Ю. Тертычный-Даури

тогда получим

1 0 0 0 0 ...

0

K21 1 0 0 0 ... K31 K32 1 0 0 ... ∆ = 0 K42 K43 1 0 ... 0 0 K53 K54 1 ...
i i i i i ...

0 0 0 =1, 0 i

0 0 0 0 i ... Kn(n−2)Kn(n−1)1

причем, если ∆ir = 0 — алгебраическое дополнение для элемента Kir , то

∆ir = 0 (i > r ) , ∆rr = 1.

Пользуясь правилом Крамера, можем написать для неизвестных ur :

r−1 r−1

∑ ∑ur = ωr +

∆irωi = ωr +

Sriωi , r = 1, n ,

i=r−2

i=r−2

(6)

где ω−1 = ω0 = 0 (r = 1, 2) ; Sri = ∆ir .
Данный итерационный прием можно применить для исходного интегрального уравне-

ния (2). Тогда его решение u (t ) при переходе от конечного числа переменных к бесконечно-

му получим из соотношения (6) в виде интегрального равенства
t
u (t) = ω(t ) + ∫ S (t, s)ω(s) ds , t−h
где S (t, s) — разрешающее ядро уравнения (2).

(7)

Интегральные преобразования. Требуется с помощью итерационного приближения

найти решение (7), для обоснования которого подставим выражение (6) в уравнение (5):

∑ ∑ ∑ωi

+

i−1
Sik ωk
k =i−2

+

i−1
wk
k =i−2

⎛ ⎝⎜⎜

Kik

+

i−1
Kir Srk
r =k +1

⎞ ⎟⎠⎟

=

ωi

.

После сокращения на ωi придем к равенствам

i−1

∑Sik + Kik +

Kir Srk = 0 ,

(8)

r=k +1

откуда при переходе от конечного числа переменных к бесконечному с учетом изменения ин-

декса k получим:

s−h s−h
∫ K (t,ξ) S (ξ, s) ds = ∫ S (t,ξ) K (ξ, s) dξ = S (t, s) + K (t, s) .
ss
Заменив t на ξ , умножим уравнение (2)

(9)

ξ
u (ξ) + ∫ K (ξ, s)u (s) ds = ω(ξ) ξ−h
( )K (ξ, s) = e−α(ξ−s), α > 0 на S (t,ξ) и проинтегрируем результат по ξ от t − h до t :

t tξ

t

∫ S (t,ξ)u (ξ) dξ + ∫ S (t,ξ) dξ ∫ K (ξ, s)u (s) ds = ∫ S (t,ξ)ω(ξ) dξ .

t−h t−h ξ−h

t−h

(10)

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2013. Т. 56, № 4

Эредитарная модель инерционного запаздывания в задаче оптимального управления

31

В предположении, что S (t, s) , K (t, s) — это скалярные функции, домножим на u (s)

соотношение (9) и проинтегрируем по s от t − h до t :

ts

t

∫ u (s) ds ∫ K (t,ξ) S (ξ, s) dξ = − ∫ ⎡⎣S (t, s) + K (t, s)⎤⎦ u (s) ds .

(11)

t−h s−h

t−h

Обобщим формулу Дирихле на двойные интегралы с переменными верхними и нижни-

ми пределами интегрирования:

bs

bb

∫ ds∫ f (s,ξ) dξ = ∫ dξ∫ f (s,ξ) ds ,

aa



где a, b — фиксированные числа.

(12)

В этой связи для всякой непрерывной по своим аргументам функции f ( s, ξ) можно до-

казать следующее равенство (ср. с равенством (12)):

bs



∫ ds ∫ f (s,ξ) dξ = ∫ dξ ∫ f (ξ, s) ds ,

(13)

a s−h

a ξ−h

где h = const > 0 .

В отличие от формулы изменения порядка интегрирования (12), когда области интегри-

рования слева ( ∆1 ) и справа ( ∆2 ) одинаковы, в (13) области ∆1 и ∆2 различны, но симмет-

ричны относительно оси ξ = s и имеют одинаковые площади, что обеспечивает равенство

повторных интегралов слева и справа (рис. 2).

ξ

ξ=s+h

ξ=s

b ∆2
a
h

ξ=s–h ∆1

0s

–h

Рис. 2
Для обоснования равенства (13) можно использовать и такой аргумент: поменяв в левой
части местами переменные s и ξ , получим его правую часть.

Воспользуемся далее равенством (13) в соотношении (10), которое можно переписать в виде

t ts

t

∫ S (t,ξ)u (ξ) dξ + ∫ u (s) ds ∫ K (t,ξ) S (ξ, s) dξ = ∫ S (t,ξ)ω(ξ) dξ ,

t−h t−h s−h

t−h

или, принимая во внимание выражение (11):

t t tt
∫ S (t,ξ)u (ξ) dξ − ∫ K (t, s)u (s) ds − ∫ S (t, s)u (s) ds = ∫ S (t,ξ)ω(ξ) dξ .
t−h t−h t−h t−h

(14)

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2013. Т. 56, № 4

32 Д. А. Музыка, Р. О. Пещеров, В. Ю. Тертычный-Даури

Сократив слева первое и третье слагаемые в (14), получим интегральную формулу
tt
− ∫ K (t, s)u (s) ds = ∫ S (t,ξ)ω(ξ) dξ t−h t−h
с взаимным ядром S (t, s) , разрешающую уравнение (2).
Процедура вычисления ядерных функций. Опишем процедуру для вычисления опре-
делителей Sik = δki , а тем самым и ядерных функций S (t, s) , в соотношении (7). Для этого
вернемся к равенствам (8). Будем считать, что
Sik = Ki(k1) + Ki(k2) + ... + Ki(kl) , где Ki(kl) — слагаемое порядка l ; l — некоторое заданное натуральное число. Запишем соотношения (8) в виде

∑ ( )Ki(k1) + Ki(k2) + ... + Ki(kl) + Kik +

Kir

K

(1)
rk

+

K

(2)
rk

+

... +

K r(kl −1)

=0

r=k +1

(15)

и положим в выражении (15):

∑ ∑ ∑K1(k1) = −Kik , Ki(k2) = i−1 Ki(k1)Kr(1k) , Ki(k3) = i−1 Ki(r1)Kr(k2) , … , Ki(kl) = i−1 Ki(r1)Kr(kl−1) .

r=k +1

r=k +1

r=k +1

Чтобы отсюда найти S (t, s) , перейдем от конечного числа переменных к бесконечному

на промежутке ξ ∈[s,t] :

K (1) (t, s) = −K (t, s),

K

(2)

(t,

s)

=

t


K

(1)

(t,

ξ)

K

(1)

(ξ,

s)

d ξ,

s

t
K (3) (t, s) = ∫ K (1) (t, ξ) K (2) (ξ, s) dξ,

s

.........................................................

где s ∈[t − h,t] и

t
K (l) (t, s) = ∫ K (1) (t, ξ) K (l−1) (ξ, s) dξ, s

S

(

t,

s

)

=




K

(l

)

(

t

,

s

),

lim K (l) (t, s) = 0 .

l=1 l→∞

Вследствие ограниченности функции K (t, s) : K (1) (t, s) ≤ M = const ∀t, s , а также вы-

текающих при интегрировании неравенств

K (1) (t, s) ≤ M ,

K (2)

(t, s)



M

2 t−s 1!

,

…,

K (l )

(t, s)



M l t − s l−1
(l −1)!

приведенный ряд для S (t, s) равномерно сходится.

Заключение. В настоящей статье предложена схема формирования блока запаздывания по времени в канале управляющего воздействия, основанная на использовании интегральных и интегродифференциальных уравнений Вольтерра с переменными пределами интегрирова-

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2013. Т. 56, № 4

Эредитарная модель инерционного запаздывания в задаче оптимального управления

33

ния. Для соответствующего интегрального уравнения Вольтерра приведена итерационная процедура решения и получена формула для формирования управления в зависимости от величины запаздывания. По мнению авторов, эредитарная модель построения БЗ представляется наиболее естественной и эффективной при синтезе закона управления с запаздыванием по времени, основанного на беллмановской процедуре оптимизации. Эта процедура предполага-
ет формирование в БЗ сначала u0 (t − h) (1), а затем u0 (t ) по формуле (7), а не наоборот, как

это обычно имеет место при неоптимизационном синтезе: u (t ) → u (t − h) . Для исходного
интегрального уравнения Вольтерра второго рода с двумя переменными пределами интегрирования применительно к задаче управления с запаздыванием по времени введена интегральная формула решения с помощью итеративной приближенной процедуры решения, которая обобщается на случай перехода от конечного числа переменных к бесконечному.

СПИСОК ЛИТЕРАТУРЫ

1. Колмановский В. Б., Носов В. Р. Устойчивость и периодические режимы регулируемых систем с последействием. М.: Наука, 1981. 448 с.

2. Бобцов А. А. Адаптивное и робастное управление неопределенными системами по выходу. СПб: Наука, 2011. 174 с.

3. Пыркин А. А. Управление в условиях запаздывания // Науч.-техн. вестн. СПбГУ ИТМО. 2007. Вып. 38. С. 287—292.

4. Вольтерра В. Теория функционалов, интегральных и интегродифференциальных уравнений. М.: Наука, 1982. 304 с.

5. Вольтерра В. Математическая теория борьбы за существование. М.: Наука, 1976. 286 с.

6. Лузин Н. Н. К изучению матричной теории дифференциальных уравнений // АиТ. 1940. № 5. С. 4—66.

7. Тертычный-Даури В. Ю. Галамех. Т. 4. Оптимальная механика. М.: Изд-во физ.-мат. лит., 2008. 608 с.

8. Тертычный-Даури В. Ю. Условная задача оптимального управления: адаптивный метод решения // АиТ. 2006. № 3. C. 54—67.

Дмитрий Александрович Музыка Руслан Олегович Пещеров Владимир Юрьевич Тертычный-Даури

Сведения об авторах — студент; Санкт-Петербургский национальный исследователь-
ский университет информационных технологий, механики и оптики, кафедра систем управления и информатики; E-mail: 146038@niuitmo.ru — студент; Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, кафедра систем управления и информатики; E-mail: rpeshcherov@mail.ru — д-р физ.-мат. наук, профессор; Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, кафедра высшей математики, кафедра систем управления и информатики; E-mail: tertychny-dauri@mail.ru

Рекомендована кафедрой систем управления и информатики

Поступила в редакцию 13.12.12 г.

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2013. Т. 56, № 4