Например, Бобцов

АЛГОРИТМ КОРРЕКЦИИ СТРУКТУРЫ УПРАВЛЕНИЯ АВТОМАТИЧЕСКИМ ПОДВОДНЫМ АППАРАТОМ ДЛЯ ПОСТРОЕНИЯ ОБЛАСТИ ДОСТИЖИМОСТИ

21
УДК 681.513.54:629.7.015
В. В. МАЛЫШЕВ, Д. С. КАБАНОВ
АЛГОРИТМ КОРРЕКЦИИ СТРУКТУРЫ УПРАВЛЕНИЯ АВТОМАТИЧЕСКИМ ПОДВОДНЫМ АППАРАТОМ ДЛЯ ПОСТРОЕНИЯ ОБЛАСТИ ДОСТИЖИМОСТИ
Рассматривается алгоритм коррекции структуры управления автоматическим подводным аппаратом, полученной с использованием принципа максимума, для построения области достижимости. Приведены результаты численного моделирования и сравнительного анализа алгоритма с решением задачи методом Крылова — Черноусько. Ключевые слова: принцип максимума, прогнозирующая модель, область достижимости, автоматический подводный аппарат.
При решении задач управления автоматическим подводным аппаратом в ряде случаев (например, при оценке его маневренных возможностей с учетом ограничений на перегрузки, расход топлива, скорость движения, а также при решении игровых задач о встрече движений) возникает проблема построения областей достижимости (ОД), исследованию которой посвящено множество работ (см. например, [1—3]). Построение ОД в темпе движения подводного аппарата затруднительно, так как необходимо обеспечить надежную сходимость решения двухточечных краевых задач. Для преодоления этих трудностей предлагается использовать алгоритм коррекции структуры управления [4], полученной с использованием принципа максимума [5, 6], с помощью которого вычисляются граничные точки ОД.
В настоящей статье рассматривается задача управления центром масс автоматического подводного аппарата (далее — ПА) на основе критерия, характеризующего удаление ПА на максимальное расстояние от точки старта в выбранном направлении с учетом ограничения на управление (выпуклая часть границы ОД). Полагается, что вектор состояния ПА точно известен в любой момент времени. При этом выявляется структура оптимального управления, использование которой предусматривает вычисление сигнала управления по различным формулам на соответствующих участках интервала оптимизации.
Требуется найти такую программу изменения нормальной перегрузки ny(t) [7, 8], которая позволит обеспечить за время tf перевод ПА из начального положения в вертикальной плоскости в максимально удаленное от точки старта положение в выбранном направлении движения, заданном единичным вектором b и углом ξ его наклона относительно стартовой системы координат. На величину перегрузки ny накладывается ограничение. Построение
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2012. Т. 55, № 7

22 В. В. Малышев, Д. С. Кабанов

выпуклой части границы области достижимости автоматического ПА осуществляется путем

изменения угла ξ [1, 3].

При такой формулировке требований к управляемому движению ПА становится воз-

можным удерживать его в эксплуатационной области, которая формируется исходя из усло-

вий достижения максимальной дальности хода в выбранном направлении и обеспечения

безопасности функционирования объекта управления при заданных конструктивных ограни-

чениях на прочность ПА. В качестве управляющего воздействия (сигнала) выбирается пере-

грузка ny. Для упрощения описания алгоритма управления положим [4], что скорость ПА изменя-

ется незначительно в процессе маневра. Уравнения движения центра масс ПА в вертикальной

плоскости имеют следующий вид [7, 8]:

( )θ

=

g V

ny − cos θ

;

x = V cos θ ; y = V sin θ ,

(1)

где (θ x y)T = X — вектор состояния ПА; θ — угол наклона траектории ПА; x , y —

продольная дальность движения и глубина погружения ПА соответственно; V — скорость ПА; g — ускорение свободного падения.

Граничные условия задачи: θ (0) = θ0 , x (0) = x0 , y (0) = y0 , где θ0 , x0 , y0 — заданные
величины. При построении выпуклой части границы ОД осуществляется минимизация критерия
оптимальности, характеризующего точку касания границы ОД с прямой, перпендикулярной направлению вектора b [1, 3]:

J = F[X(t f )] = −bT X(t f ) = −x(t f ) cos ξ − y(t f )sin ξ ,

(2)

где bT = [0 cos ξ sin ξ] .

Для формирования структуры оптимального управления обратимся к необходимым ус-

ловиям оптимальности [5, 6, 9, 10]. Запишем гамильтониан для системы (1) с критерием каче-

ства (2):

( )H

=

ψθ

g V

ny − cos θ

+ ψxV cos θ + ψ yV sin θ ,

( )где ψθ ψx ψ y T = Ψ — вектор сопряженных переменных [5].

В соответствии с принципом максимума сопряженные переменные определяются из

уравнения

Ψ

=



⎛ ⎝⎜

∂H ∂X

⎞T ⎠⎟

,

или

в

поэлементном

виде:

ψ θ

=

−ψθ

g V

sin θ + ψ xV

sin θ − ψ yV

cos θ ,

ψ x

=

0,

ψ y

=

0,

(3)

( )с граничными условиями Ψ t f

=

⎛ ⎜ ⎝

∂F[X(t ∂X

f

)]

⎞T ⎟ ⎠

,

а

сигнал

управления

определяется

из

усло-

( ) ( )вия

inf H
ny∈[−nym , nym ]

X, Ψ, ny , t

=H

X, Ψ, nyоc , t

. При существовании конечного интервала

времени, на котором ψ0 = 0 , требуется ввести „особое“ управление nyоc . Тогда

ny

=

⎪⎩⎪⎧⎨−nynоycmпsрgиn(ψψθθ

) при ψθ = 0 для t

≠ ∈

0; [τ1,

τ2

],

(4)

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2012. Т. 55, № 7

Алгоритм коррекции структуры управления

23

а „особое“ управление

nyоc

согласно условию

d2 dt 2

⎛ ∂H ⎜⎜⎝ ∂ny

⎞ ⎟⎟⎠ = 0

[10] характеризуется выражением

nyоc

=

gψθ

gψθ −V 2ψx cos θ −V 2ψ x cos θ −V 2ψ y

sin θ

.

Здесь nym — предельное значение перегрузки, τ1, τ2 ∈[0, t f ] — моменты, ограничивающие

интервал времени нахождения ПА на траектории, соответствующей предельным углам ее на-

клона.

„Особое“ управление возникает в случае, когда ψθ = 0 и ψ θ = 0 на интервале [τ1, τ2 ] .

( )Тогда ψ θ = ψxV sin θ − ψ yV cos θ, и с учетом уравнений (3) при граничных условиях ψx t f =

( )= − cos ξ , ψ y t f = − sin ξ получаем V (− cos ξ) sin θ +V (sin ξ) cos θ = 0 , откуда sin(ξ − θ) = 0 ,

тогда nyоc = cos ξ .
Решение краевой задачи (1), (3), (4) методом Ньютона [4, 11, 12] связано с вычислительными трудностями, обусловленными поиском начального приближения для сопряженно-

го вектора Ψ (0) и обеспечением сходимости алгоритма при изменении граничных условий

задачи оптимизации. Для преодоления этих трудностей рассмотрим следующую вспомога-
тельную задачу оптимизации. Представим сигнал управления ny в общем виде [4], когда возможно несколько переключений (например, два):

ny = −nymsgn(ψθ0 ) + ∆ny1l(t, τ1) + ∆ny2l(t, τ2 ) ,

( ) ( )где ψθ0 = ψθ (0) , ∆ny1 = nymsgn ψθ0 + nyоc , ∆ny2 = −nyоc + nymsgn ψθ0 , а l(t, τ1) , l(t, τ2 ) —

функции вида

l (t , t1 )

=

1 2

+

1 π

arctg

(

k

(t



t1 ))

,

Здесь k — коэффициент, при неограниченном возрастании которого функция l(t,t1) прибли-

жается к единичной функции Хэвисайда (для задач с управлением релейного типа аналогич-

ная структура рассмотрена в работах [5, 8, 9]).

На рис. 1 приведен график функции l(t,t1) при t1 = 4, k = 10 000.

l(t)

1,0

0,8

0,6

0,4 0,2

–2 0

2 4 6 8 10 t

Рис. 1

Моменты переключения τ1 и τ2 функции ny(t) будем рассматривать в качестве компо-

нент расширенного вектора состояния объекта, а в качестве сигналов управления выберем

производные от τ1 и τ2 по времени. Тогда динамика объекта управления может быть пред-

ставлена уравнениями

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2012. Т. 55, № 7

24 В. В. Малышев, Д. С. Кабанов

( ( ) )θ

=

g V

−n ym sgn

ψθ0

+ ∆ny1l (t, τ1 ) + ∆ny2l (t, τ2 ) − cos θ

,

(5)

x = V cos θ , y = V sin θ , τ1 = w1 , τ2 = w2 .

Здесь ( w1 w2 )T = w — вектор управления во вспомогательной задаче оптимизации. Таким

образом, управление осуществляется косвенно — через вектор управления w .

Для поиска оптимальной траектории движения автоматического ПА предлагается ис-

пользовать алгоритм коррекции структуры управления с помощью прогнозирующей модели

[5, 8, 9]. В отличие от указанных работ, в рассматриваемой в данной статье структуре управ-

ления имеется „особое“ управление nyоc = cos ξ .

В соответствии с алгоритмом на основе прогнозирующей модели в качестве критерия

оптимальности выберем функционал Красовского [5]:

∫ ∫J1

=

F[X(t f

)] +

1 tf 20

wT



k

−2 w

⋅ wdt

+

1 2

tf 0

wToпт



k

−2 w

⋅ woпт dt

,

(6)

( ) ( )где F[X(t f )] = −x t f cos ξ − y t f sin ξ ; wопт — оптимальное значение вектора управления w ,

( )( )woпт =

w1oпт w2oпт

T,

k

2 w

=

diag

kw21 , kw22

, коэффициенты kw21

и

kw22

определяются модели-

рованием при отладке вычислительного алгоритма.

∫ ∫Введение слагаемых

1 tf 20

wT



k

−2 w

⋅ wdt

и

1 2

tf 0

wToпт



k

−2 w



woпт dt

в исходный критерий

оптимальности фактически не меняет требований задачи, ибо по завершении переходных процес-

сов переключения τ1(t) , τ2 (t) имеем τ1 = 0 , τ2 = 0 , что приводит к обнулению этих слагаемых.

Запишем гамильтониан вспомогательной задачи оптимизации:

( )H

=

ψθ

g V

ny − cos θ

+ ψxV cos θ + ψ yV sin θ + ψτ1 w1 + ψτ2 w2 +

+

1 wT 2



k

−2 w

⋅w

+

1 2

wToпт



k

−2 w

⋅ woпт .

Система канонических уравнений имеет следующий вид:

( )( )θ

=

g V

−nym sgn ψθ0

+ ∆ny1l (t − τ1 ) + ∆ny2 l (t − τ2 ) − cos θ ,

x = V cos θ , y = V sin θ , τ1 = 0 , τ2 = 0 ,

ψ θ

=

−ψθ

g V

sin

θ

+

ψ xV

sin

θ



ψ yV

cos θ

,

ψ x

= 0,

ψ y

=0,

ψ τ1

=

ψθ

g V

∆ny1δ (t, τ1 ) ,

ψ τ2

=

ψθ

g V

∆ny2 δ (t, τ2 ) ,

где δ(t, τ1 ) , δ(t, τ2 ) — функции вида

δ(t,t1 ) =

∂l (t , t1 ) ∂t1

=

π

(1 +

k k 2 (t



t1)2 )

.

Из условия трансверсальности получаем

( )ΨT t f

=

∂F[X (t ∂X (t f

f )] )

или в развернутом виде

(7)

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2012. Т. 55, № 7

Алгоритм коррекции структуры управления

25

( ) ( ) ( ) ( ) ( )ψθ t f = 0 , ψx t f = − cos ξ , ψ y t f = −sin ξ , ψτ1 t f = 0 , ψτ2 t f = 0 .

(8)

Составляющие вектора управления

w1 (t ) = −kw21 ψτ1 ( τ1 ) , w2 (t ) = −kw22 ψτ2 ( τ2 ) .

(9)

Алгоритм вычисления сигнала управления с использованием прогнозирующей модели

состоит из следующих действий.

1. Численное интегрирование системы уравнений (7) в прямом времени на интервале

[t, t f ] при начальных условиях X (t ) , Ψ (t ) (на первом шаге t = 0 ).

( ) ( )2. По найденным значениям X t f определение граничных условий (8) для Ψ t f при

совместном решении в обратном времени системы уравнений (7) на интервале [t, t f ] для на-

хождения Ψ (t ) .

3. Вычисление составляющих вектора управления (9). 4. Интегрирование системы уравнений (5) при выбранных сигналах управления на один

шаг, определение нового значения X (t ) .

5. Повторение процесса вычислений начиная с п. 1 до достижения конечного момента времени tf .
Как видно из алгоритма, для определения сигнала управления не требуется решать двухточечную краевую задачу. Вычисления сводятся к решению двух задач Коши, решаемых в прямом и обратном времени соответственно.
На рис. 2—4 приведены графики, полученные для начальных условий движения ПА:
ξ = 20°, V = 30 м/с, θ0 = 0, x0 = 0, y0 = –100 м, τ1 = 1 с, τ2 = 6 с, nym = 3 , kw21 = 0, 2 , kw22 = 0, 3 ,
tf = 8 с, шаг интегрирования 0,01 c. На рис. 2 представлены траектория движения автоматического ПА и графики зависимо-
сти угла θ и сигнала управления ny от времени t, полученные с использованием предлагаемого численного метода решения.
y, м 20
0 –20 –40 –60 –80 –100 –120 –140

0 50 100 150 200 x, м

θ, …° 25 20 15 10 5
0 1 2 3 4 5 6 7 t, с

ny
3 2 1 0 –1 –2 –3
0 1 2 3 4 5 6 7 t, с

Рис. 2

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2012. Т. 55, № 7

26 В. В. Малышев, Д. С. Кабанов

На рис. 3 представлены графики зависимости управления моментами переключений τ1

и τ2 от времени, наглядно демонстрирующие, что момент τ1 сходится к оптимальному зна-

чению, а τ2 стремится к t f , траектория как бы растягивается в прямую линию в целях дос-

тижения максимальной дальности.

τ1, c τ2, c 1,2 8

1,1

7,8 7,6

1 7,4

0,9

7,2 7

0,8 6,8

0,7

6,6 6,4

0,6 6,2

0,5 6

0 0,2 0,4 0,6 0,8 1 t, с

0 1 2 3 4 5 6 7 t, с

Рис. 3

Как видно из представленных графиков, фактически имеется только одно переключение τ1,

что подтверждается физической сутью задачи.

График области достижимости при изменении угла ξ от –70 до 20° при начальных усло-

виях, обозначенных выше, приведен на рис. 4.

y, м

–50

–100

–150 –200

–250

–300
0 50 100 150 200 х, м
Рис. 4
Полученное решение можно использовать в качестве начального приближения для управления по методу Крылова — Черноусько, что сокращает число итераций при поиске оптимального управления. В рассматриваемых диапазонах изменения угла ξ использование такого начального приближения позволяет найти оптимальную программу для ny за 1—2 итерации. Выбор начального приближения при τ2 = t f и неоптимальном значении τ1, отличаю-
щемся от оптимального на 1 с, приводит к решению за 8 итераций. В отличие от этого разработанный алгоритм коррекции структуры управления обеспечивает решение при произвольном выборе значений параметров τ1 и τ2 из интервала оптимизации.

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2012. Т. 55, № 7

Алгоритм коррекции структуры управления

27

Проведенные исследования показали устойчивую работу предложенного алгоритма при изменении условий задачи и начальных значений параметров системы управления. Алгоритм может быть применен и для построения вогнутой части границы области достижимости, а также для построения ее границ в пространстве при изменении скорости автоматического подводного аппарата, когда „особые“ управления определяются по более сложным зависимостям [4]. При этом объем вычислений изменяется незначительно, что позволяет осуществлять построение границы ОД в процессе движения.

СПИСОК ЛИТЕРАТУРЫ

1. Черноусько Ф. Л. Оценивание фазового состояния динамических систем. Метод эллипсоидов. М.: Наука, 1988. 319 с.

2. Красовский Н. Н. Игровые задачи о встрече движений. М.: Наука, 1970. 420 с.

3. Толпегин О. А. Области достижимости летательных аппаратов. СПб: БГТУ, 2002. 106 с.

4. Малышев В. В., Кабанов Д. С. Оптимизация траектории движения материальной точки в пространстве с использованием алгоритма с заданной программой прогноза движения при ограничениях на управление // Тез. докл. 15-й Междунар. конф. „Системный анализ, управление и навигация“. М.: Изд-во МАИ-ПРИНТ, 2009. С. 61—62.

5. Справочник по теории автоматического управления / Под ред. А. А. Красовского. М.: Наука, 1987. 712 с.

6. Малышев В. В. Методы оптимизации в задачах системного анализа и управления: Учеб. пособие. М.: Изд-во МАИ-ПРИНТ, 2010. 440 с.

7. Лебедев А. А., Чернобровкин Л. С. Динамика полета беспилотных летательных аппаратов. Учеб. пособие. М.: Машиностроение, 1973. 616 с.

8. Буков В. Н. Адаптивные прогнозирующие системы управления полетом. М.: Наука, 1987. 232 с.

9. Кабанов С. А. Управление системами на прогнозирующих моделях. СПб: Изд-во СПбГУ, 1997. 200 с.

10. Горбатенко С. А., Макашов Э. М., Полушкин Ю. Ф., Шефтель Л. В. Расчет и анализ движения летательных аппаратов: Инж. справочник. М.: Машиностроение, 1971. 352 с.

11. Федоренко Р. П. Приближенное решение задач оптимального управления. М.: Наука, 1978. 488 с.

12. Кабанов Д. С. Оптимальное управление ядерным реактором с учетом случайных возмущений // Изв. вузов. Приборостроение. 2009. Т. 52, № 5. С. 27—30.

Вениамин Васильевич Малышев Дмитрий Сергеевич Кабанов

Сведения об авторах — д-р техн. наук, профессор; Московский авиационный институт (на-
циональный исследовательский университет), кафедра системного анализа и управления; E-mail: veniaminmalyshev@mail.ru — аспирант; Московский авиационный институт (национальный исследовательский университет), кафедра системного анализа и управления; E-mail: kabanovds@mail.ru

Рекомендована кафедрой системного анализа и управления

Поступила в редакцию 16.01.12 г.

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2012. Т. 55, № 7