Например, Бобцов

МЕТОД ПОСТРОЕНИЯ ОБЛАСТЕЙ ДОСТИЖИМОСТИ ДЛЯ НЕЛИНЕЙНЫХ УПРАВЛЯЕМЫХ СИСТЕМ

Метод построения областей достижимости для нелинейных управляемых систем

43

УДК 681.5.01:629.7.05

А. А. СИЗОВА
МЕТОД ПОСТРОЕНИЯ ОБЛАСТЕЙ ДОСТИЖИМОСТИ ДЛЯ НЕЛИНЕЙНЫХ УПРАВЛЯЕМЫХ СИСТЕМ

Рассматривается задача построения областей достижимости летательного аппарата при действии возмущений с неизвестными статистическими характеристиками. Граница области достижимости строится по точкам на основе решения вспомогательной конфликтной задачи, для которой предлагается итерационный алгоритм. Разработана программа, реализующая предложенный метод и демонстрирующая эффективность его применения.

Ключевые слова: область достижимости, конфликтная задача, система стабилизации, оптимальное управление.

При решении многих задач динамики полета летательного аппарата (ЛА) возникает

проблема определения области возможных его положений в пространстве для различных мо-

ментов времени.

Пусть движение любой управляемой системы определяется векторным дифференциаль-

ным уравнением

dz dt

=

f

(t,

z (t ), u (t ))

,

где zT = (z1, z2 , ..., zn ) — вектор состояния системы; f T = ( f1, f2 , ..., fn ) — непрерывная вектор-

функция; uT = (u1,u2 , ..., um ) — вектор сигнала управления, удовлетворяющий ограничению u(t)∈U ,

где U — допустимое множество управлений.

Заданы начальные условия

t = t0 , z(t0 ) = z0 . Областью достижимости (ОД) управляемой системы в фазовом пространстве в мо-

мент времени Т (Т > t0 ) называется [1] множество всех состояний системы, в каждое из кото-

рых к моменту времени Т возможен перевод системы из начального состояния z0 посредством выбора вектор-функции управления u(t) , удовлетворяющей заданным ограничениям.

Методы построения ОД находят применение при исследовании законов управления ди-

намическими системами [2], при решении задач оптимального управления с фиксированным

моментом окончания управляемого движения и сложными терминальными условиями [3]. Эти

методы используются также при исследовании инвариантности управляемых систем [4], при

решении задач векторной оптимизации [3], при идентификации динамических систем [5].

В частности, методы построения ОД эффективны при решении игровых задач управле-

ния [6, 7]. Например, при решении конфликтной задачи сближения — уклонения двух ЛА

сигнал управления одного из них (преследователя) выбирается на основе анализа взаимного

расположения ОД преследователя и преследуемого [6]. Или другой пример — для решения

задач стабилизации: при наличии внешних возмущений и помех с неизвестными статистиче-

скими характеристиками управление целесообразно выбирать, основываясь на вычислении

будущего гарантированного результата. Например, с учетом влияния ветра или взрывной вол-

ны можно считать, что воздействие имеет любые статистические характеристики, но ограни-

чено по абсолютной величине. Рассматривать подобную задачу можно как дифференциаль-

ную игровую задачу с участием двух игроков. Первый игрок за счет выбора управления

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 7

44 А. А. Сизова
стремится стабилизировать ЛА, а второй игрок, путем внесения помех и возмущений, действует наихудшим для первого игрока образом. Для решения данной задачи можно также использовать подход, основанный на анализе взаимного расположения ОД [6].
Рассмотрим приближенный алгоритм построения ОД на примере нелинейной системы стабилизации нормальной перегрузки ЛА при наличии возмущений с неизвестными статистическими характеристиками. Движение ЛА в вертикальной плоскости с учетом динамики системы стабилизации перегрузки определяется следующими дифференциальными уравнениями [8]:

dV dt

=



cx qS M

−g

sin

θ;

dθ dt

= cαy α

qS МV

+cδyв δв

qS МV



g

cos V

θ

;

{ }dδв
dt

=

1 τ

kпр ε − δв

;

dx dt

=V

cos

θ;

⎫ ⎪ ⎪ ⎪ ⎪

d ωz dt

=

⎛ ⎜⎝

mzα

α

+

mzδв

δв

+

mzωz

ωz V

l

+

mzξ

ξ

⎞ ⎟⎠

q

Sl Jz

;

dy dt

=

V

sin

θ;

⎪ ⎪ ⎬ ⎪

dϑ dt

=

ωz

;

⎪ ⎪ ⎪

( )α = ϑ−θ; ε = kу (u−kny N y )−kωωz ; N y = cαy α+cδyв δв

qS Мg

;

zT

=[V ,θ,ωz

,ϑ,δв ,

x,

y],⎪⎪⎭

(1)

здесь θ — угол наклона траектории движения ЛА к горизонту; ωz — угловая скорость ЛА вокруг поперечной оси z; ϑ — угол тангажа; δв — угол отклонения рулей высоты; α — угол атаки; N y — безразмерная нормальная перегрузка ЛА; М — масса ЛА; V — скорость ЛА;

x , y — координаты ЛА в вертикальной плоскости; S — площадь миделя; q = ρV 2 2 — ско-

ростной напор; ρ — плотность воздуха; ξ — возмущение; сх — безразмерный коэффициент

лобового сопротивления; cαy , cδyв — производные коэффициента подъемной силы по углам

α и δв ; mzα , mzδв , mzωz , mzξ — производные коэффициента аэродинамического момента по углам α , δв и по величинам ωz , ξ ; τ — постоянная времени рулевого привода; kпр — ко-

эффициент усиления рулевого привода; J z — момент инерции; l — размах крыла; ε — сиг-
нал, подаваемый на вход рулевого привода; k y , kny , kω — коэффициенты контура стабили-
зации нормальной перегрузки. Структурная схема контура стабилизации перегрузки ЛА в продольной плоскости, со-

ответствующая

математической

модели

(1),

представлена

на

рис.

1

⎛ kпр

⎜ ⎝

τp

+1



передаточная

функция рулевого привода, учитывающая инерционность в работе его подвижных частей).

Будем считать начальное положение ЛА заданным:

t0 = 0 , V (0) = V0 , θ(0) = θ0 , ϑ(0) = ϑ0 , ωz (0) = ωz0 , δв (0) = δв0 , x(0) = x0 , y(0) = y0 , (2)

а управляющий сигнал и возмущение ограниченными:

u(t) ≤ umax ,

(3)

ξ(t) ≤ ξmax .

(4)

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 7

Метод построения областей достижимости для нелинейных управляемых систем

45

Для рассматриваемой системы (1) область достижимости будем строить в плоскости N yON y (рис. 2) для некоего, заранее заданного, момента времени T ; N yON y — плоскость
параметров системы, которые необходимо стабилизировать.

u

ky

ε

kпр τр + 1

δв

ЛА ωz, Ny

kω ωz

kny
Рис. 1 . Ny

Ny

ОД

L О0

ϕ

Ny

Рис. 2
Для системы (1) при условиях (3), (4) ОД является ограниченной и замкнутой [6], значит, достаточно построить только границу ОД, которую будем строить по точкам [9].

В плоскости N yON y с помощью единичного вектора LT =[cos ϕ sin ϕ] зададим на-

правление движения ЛА, здесь ϕ — угол между осью ОNy и вектором L. Смещение ЛА в

направлении вектора L из некоторой позиции {t*, z(t* )} к моменту времени T будем характе-

ризовать скалярным произведением вектора L и вектора параметров системы, которые необходимо стабилизировать: w(T ) = (N y (T ), N y (T )) , т.е. функционалом вида

D = LT w(T ) = N y (T ) cos ϕ+ N y (T ) sin ϕ .

(5)

Из определения понятия ОД можно сделать вывод о том, что чем больше размеры ОД, тем больший диапазон требуемых значений стабилизируемых параметров может она обеспечить. А значит, управление системой должно выбираться таким, чтобы размеры ОД были максимальными, т.е. необходимо максимизировать критерий (5) для всех направлений вектора L. Предположим при этом, что действие возмущений носит наихудший для ЛА характер, и, следовательно, функция ξ(t) должна выбираться такой, чтобы минимизировать критерий

(5). Таким образом, задача (1)—(5) является конфликтной задачей. Результатом решения данной конфликтной задачи при определенном значении угла ϕ

будет точка с координатами N y (T ) и N y (T ) , которая и является точкой границы ОД. Таким

образом, изменяя значение угла ϕ от 0 до 360°, построим границу ОД в предположении, что

ОД является выпуклой.

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 7

46 А. А. Сизова

Для решения вспомогательной конфликтной задачи используем следующий итерационный алгоритм.
1. Задаем начальные программы управления и возмущения u0 (t) , ξ0 (t) .
2. С использованием принципа максимума Понтрягина [10] находим оптимальную программу управления u1(t) , обеспечивающую максимальное смещение ЛА в направлении век-
тора L при заданной программе ξ0 (t) .
3. Фиксируем программу управления u1(t) и на основе принципа максимума Понтрягина находим оптимальную программу возмущения ξ1(t) , обеспечивающую минимальное сме-
щение в направлении вектора L. 4. Фиксируем программу возмущения ξ1(t) и находим новую оптимальную программу
управления u2 (t) , и т.д.
5. Продолжаем итерации до тех пор, пока на некотором шаге k программы uk (t) и ξ k (t) не будут удовлетворять условию uk (t) = uk−1(t) , ξ k (t) = ξ k−1(t) .
Принимаем полученные программы uk (t) и ξ k (t) в качестве оптимальных решений в
рассматриваемой конфликтной задаче. Для решения задачи (5) при фиксированных программах управления или возмущения
использовались необходимые условия принципа максимума Понтрягина [10], а возникающая краевая задача решалась на основе метода последовательных приближений Крылова — Черноусько [11].
Уточним задачу расчета координат точки границы ОД на примере некоего гипотетического ЛА. Зададим значения параметров гипотетического ЛА: l =5,3 м; S =0,129 м2;
М=395 кг; J z =981 кг⋅м2; mzα =–0,022 1/…°; mzδв =–0,011 1/…°; mzωz =–0,761; cαy =0,15 1/…°;

cδyв = 0,046 1/…°; cx =0,15; kпр =1 , τ = 0,1 с; kny = 0,336; k y = –0,002; kω = –0,0805.

Рассмотрим движение системы (1) при фиксированной программе ξi (t) . Требуется най-

ти оптимальное управление, обеспечивающее максимум функционала (5) в заданный момент

времени T при ограничении на управление (3) и начальных условиях (2).

В соответствии с принципом максимума вместо максимума критерия (5) определим ми-

нимум критерия:

D′ = −N y (T ) cos ϕ− N y (T ) sin ϕ .

(6)

Функция Гамильтона [10] для системы (1) с критерием оптимальности (6) имеет следующий вид:

H

= −ψV

cx qS M



ψV

g

sin

θ+

ψθcαy

α

qS MV

+ψθcδyв δв

qS MV

−ψθ

g

cos V

θ

+

+

⎛ ⎜⎝

ψωmzα

α

+

ψ

ω

mzωz

ωz V

l

+

ψ

ω

mzδв

δв

+

ψω

mzξ

ξ

⎞ ⎟⎠

qSl Jz

+

ψϑ

ωz

+

( )+ψδв

1 τ

⎛ ⎝⎜⎜

kпр

⎛ ⎜

k

у



⎛ ⎝⎜

u



kny

qS Мg

сαy α +cδyв δв

⎞ ⎠⎟



kωωz

⎟⎞− ⎠

δв

⎞ ⎠⎟⎟

+

+ψxV cos θ+ψ yV sin θ.

(7)

Составим сопряженную систему уравнений:

(8)

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 7

Метод построения областей достижимости для нелинейных управляемых систем

47

d ψV dt

=



∂H ∂V

= ψV

2cx qS MV



qS MV

2

ψ

θ

(c

α y

α

+

cδyв

δв

)



ψθ

g

cos V2

θ



−ψω

2qSl J zV

(mzα

α

+

mzδв

δв

+

mzξ

ξ)



ψ

ω

mzωz

ωz V2

qSl 2 Jz

+

⎫ ⎪ ⎪ ⎪ ⎪ ⎪

+ ψδв

kпр τ

ky kny

2qS МgV

(cαy α+cδyв δв )−ψ x

cos θ−ψ y

sin θ;

⎪ ⎪ ⎪

dψθ dt

=−

∂H ∂θ

= ψV

g

cos θ+ψθcαy

qS МV

−ψθ

g

sin V

θ

+

ψωmzα

qSl Jz



− ψ δв

kпр τ

ky kny

qS Мg

cαy +ψ xV

sin θ−ψ yV

cos θ;

dψω dt

= − ∂H ∂ωz

= −ψωmzωz

qSl Jz

l V

−ψϑ +ψδв

kпр kω τ

;

dψϑ dt

= − ∂H ∂ϑ

= −ψθcαy

qS МV

−ψωmzα

qSl J z +ψδв

kпр τ

ky kny

qS Мg

cαy ;

⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎪ ⎬ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪

d ψδв dt

= − ∂H ∂δв

= −ψθcδyв

qS МV

−ψωmzδв

qSl Jz

+

ψδв τ

+ ψδв

kпр τ

ky kny

qS Мg



cδyв

;⎪ ⎪

dψx dt

=−

∂H ∂x

= 0,

⎪ ⎪ ⎪

dψy dt

=−

∂H ∂y

= 0.

⎪ ⎪ ⎪⎭

(8)

Граничные условия для фазовых координат сопряженной системы (8) определяются

следующим образом:

ψV

(T

)

=

qS Мg

2 V

(сαy α

cos

ϕ + cδyв

δв

cos

ϕ+сαy ωz

sin

ϕ) −

⎫ ⎪ ⎪



qS Мg

3сαy

⎛ ⎜⎝

сαy

α

qS МV 2

+cδyв δв

qS МV 2

⎞ ⎟⎠

sin

ϕ+

qS МV 2

сαy

cos θsin ϕ;⎪⎪ ⎪

ψθ (T ) = −сαy

qS Мg

cos ϕ+сαy

qS Мg

сαy

qS МV

sin ϕ−сαy

qS МV

sin θsin ϕ;

⎪ ⎪ ⎪

ψω (T ) = сαy

qS Мg

sin

ϕ;

⎪⎪ ⎬ ⎪

ψϑ (T ) = сαy

qS Мg

cos ϕ−сαy

qS Мg

сαy

qS МV

sin ϕ;

⎪ ⎪ ⎪

ψδв (T ) = cδyв

qS Мg

cos ϕ−cδyв

qS МV

сαy

qS Мg

sin ϕ;

⎪ ⎪ ⎪

ψx (T ) = 0, ψ y (T ) = 0.

⎪ ⎪ ⎭⎪

(9)

Таким образом, задача определения оптимального управления сводится к краевой зада-

че: найти решение систем уравнений (1) и (8), фазовые координаты которых удовлетворяют

начальным условиям (2) и граничным условиям (9).

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 7

48 А. А. Сизова

Согласно принципу максимума Понтрягина функция Гамильтона при оптимальном управлении должна достигать максимума, причем управление u(t) должно удовлетворять ог-
раничению (3). Алгоритм вычисления оптимального управления u(t) имеет вид

u

(t )

=

⎩⎨⎧+−uummaaxx

, ,

если H1 ≥ 0; если H1 < 0,

а алгоритм вычисления возмущения ξ(t) при фиксированной программе управления — вид

ξ (t

)

=

⎧+ξmax ⎨⎩−ξmax

, ,

если если

H2 ≥ 0; H2 < 0,

где

H1

=

kпр k τ

у

ψδв

, H2 = ψω

qSl Jz

mzξ .

Результаты расчета ОД при начальных условиях V (0) = 1650 м/с, θ(0) = 0 , ωz (0) = 0 ,

ϑ(0) = 0 , δв (0) = 0 , x(0) = 0 , y(0) = 6000 м представлены на рис. 3, а, б для моментов времени

Т = 0,3 c и Т = 1,5 c соответственно, при этом управление и возмущение удовлетворяют огра-

ничениям: umax = 20 , ξmax = 0,1. Точки границы ОД построены с шагом ∆ϕ =3,33°.

а) . Ny

б) . Ny

100 150

100 50 50

00

–50 –50

–100

–100

–150

–150

–8 –4

0

4

6 Ny

–200

–10 –5

0

5 10 Ny

Рис. 3

Значения критерия (5), изменяющиеся в процессе применения предложенного алгорит-

ма, приведены в таблице (для выделенной точки на рис. 3, б).

Номер итерации
1
2
3
4
5
6

Начальные программы u(t) и ξ(t)
u0 (t) = 0 ; ξ0 (t) = 0
u1 (t) ; ξ0 (t) = 0 u0 (t) = 0 ; ξ1 (t)
u2 (t) ; ξ0 (t) = 0 u0 (t) = 0 ; ξ 2 (t)
u3 (t) ; ξ0 (t) = 0 ;

Конечные программы u(t) и ξ(t)
u1 (t) ≠ u0 (t) ; ξ1 (t) ≠ ξ0 (t)
u2 (t) ≠ u1 (t) ξ 2 (t) ≠ ξ1 (t)
u3 (t) = u2 (t) ξ 3 (t) = ξ 2 (t)

D′ 101,11941 49,777366 48,120109 48,099345 48,104495 48,104495

Результаты расчета подтвердили работоспособность рассмотренного алгоритма вычисления ОД ЛА в плоскости N yON y с учетом действия возмущений. Из приведенных расчетов
следует, что ОД в плоскости N yON y является выпуклой.

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 7

Метод построения областей достижимости для нелинейных управляемых систем

49

Разработанный алгоритм может быть использован в процессе синтеза систем стабилизации скоростных ЛА при действии возмущений и помех с неизвестными статистическими характеристиками.

СПИСОК ЛИТЕРАТУРЫ

1. Красовский Н. Н. Теория управления движением. М.: Наука, 1968.

2. Крищенко А. П. Исследование управляемости и множеств достижимости нелинейных систем управления // Автоматика и телемеханика. 1984. № 6. C. 30—36.

3. Моисеев Н. Н. Математические задачи системного анализа. М.: Наука, 1981.

4. Хрусталев М. М. Точное описание множеств достижимости и условия глобальной оптимальности динамических систем // Автоматика и телемеханика. 1988. № 5. Ч. 1. C. 62—70; 1988. № 7. Ч. 2. C. 70—78.

5. Доррер Г. А. Оценка параметров динамических систем по их областям достижимости // Там же. 1986. № 1. C. 39—46.

6. Красовский Н. Н. Игровые задачи о встрече движений. М.: Наука, 1970.

7. Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры. М.: Наука, 1974.

8. Лебедев А. А., Чернобровкин Л. С. Динамика полета беспилотных летательных аппаратов. М.: Машиностроение, 1973.

9. Толпегин О. А. Области достижимости летательных аппаратов: Учеб. пособие. СПб.: БГТУ „Военмех“, 2002.

10. Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. М.: Наука, 1983.

11. Толпегин О. А. Численные методы решения задач оптимального программного управления: Учеб. пособие. Л.: Ленингр. механ. ин-т, 1987.

Анастасия Александровна Сизова

Сведения об авторе — Балтийский государственный технический университет „Военмех“
им. Д. Ф. Устинова, кафедра процессов управления, Санкт-Петербург; ведущий инженер; E-mail: yatsan28@yandex.ru

Рекомендована кафедрой процессов управления

Поступила в редакцию 10.07.08 г.

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 7