УПРАВЛЕНИЕ ОТНОСИТЕЛЬНЫМ ДВИЖЕНИЕМ КОСМИЧЕСКОГО АППАРАТА ПРИ НАБЛЮДЕНИИ ОРБИТАЛЬНЫХ ОБЪЕКТОВ ПАССИВНЫМИ СРЕДСТВАМИ

30
УДК 629.78.05
М. Г. КУДИНОВ, С. Б. СИЛАНТЬЕВ, А. В. СТЕПОВОЙ
УПРАВЛЕНИЕ ОТНОСИТЕЛЬНЫМ ДВИЖЕНИЕМ КОСМИЧЕСКОГО АППАРАТА
ПРИ НАБЛЮДЕНИИ ОРБИТАЛЬНЫХ ОБЪЕКТОВ ПАССИВНЫМИ СРЕДСТВАМИ
Предложен метод управления относительным движением космического аппарата в зоне прямой видимости наблюдаемого орбитального объекта. В качестве измерительной информации используются угловые координаты наблюдения за орбитальным объектом, определяемые пассивными бортовыми средствами космического аппарата-наблюдателя в условиях действия помех. Предлагаемый метод основан на принципах дуального управления. Ключевые слова: метод управления, относительное движение, космический аппарат-наблюдатель, орбитальный объект.
Введение. Для управления движением космического аппарата относительно какоголибо орбитального объекта необходимо иметь информацию о параметрах движения каждого из них. В практических задачах параметры движения космического аппарата-наблюдателя (КАН) известны. Будем считать, что орбитальный объект совершает пассивный полет, а получение информации о параметрах его движения возможно только с помощью бортовых средств КАН.
В настоящее время задача получения информации о параметрах относительного движения КАН решается с помощью активных средств наблюдения (дальномеров, доплеровских измерителей скорости и т. п.) [1].
Использование таких средств позволяет определить ориентацию линии визирования наблюдаемого объекта, а также относительную дальность и скорость ее изменения. Однако применение активных средств не всегда возможно, так как они имеют значительную массу и габариты, а также большое энергопотребление. Использование пассивных средств наблюдения в этом смысле представляется более предпочтительным, но при этом возникает проблема определения относительной дальности. Один из подходов к решению этой проблемы заключается в формировании управления относительным движением центра масс КАН таким образом, чтобы оно носило двойственный характер, а именно: изучающий (обеспечивающий возможность определения параметров относительного состояния двух объектов) и направляющий (обеспечивающий поддержание данных параметров вблизи их требуемых значений).
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 7

Управление относительным движением КА при наблюдении орбитальных объектов

31

Реализующие данный подход системы управления относятся к классу систем дуального управления [2].
В обычных системах этого типа управляющие воздействия, вследствие различия их частотных диапазонов и временного разделения их приложения к объекту, можно представить двумя составляющими: первая (назовем ее изучающей) обеспечивает получение информации о параметрах движения, а вторая (направляющая) — функционирование КА в заданном режиме. Однако в общем случае такое разделение не обязательно: одно и то же воздействие может иметь двойственный характер.
В системах дуального управления возникает противоречие между двумя указанными сторонами управляющего воздействия. Действительно, выполнение задачи управления относительным движением с заданным качеством возможно лишь при своевременном формировании направляющего воздействия. Воздействие, реализованное с задержкой, ухудшает качество процесса управления КА. Однако успешно управлять можно лишь тогда, когда достаточно точно известны параметры движения наблюдаемого объекта. Между тем процесс определения параметров движения требует затрат времени. Слишком „быстрое“ управляющее устройство будет производить необоснованные направляющие действия, которые не будут должным образом подкреплены полученной в результате изучения наблюдаемого орбитального объекта информацией. Слишком „осторожная“ система будет излишне долго выжидать, накапливая информацию, и не сможет своевременно выполнить поставленную задачу сближения. И в том, и в другом случае процесс управления может оказаться неоптимальным или даже неуспешным.
Неполная информация о местонахождении наблюдаемого орбитального объекта содержится в вероятностных распределениях параметров относительного движения. Эти распределения по мере изучения наблюдаемого орбитального объекта будут, вообще говоря, все точнее и точнее характеризовать эти параметры. Именно постепенное изменение апостериорных вероятностных распределений, их сосредоточение вблизи действительных значений является оценкой интервала времени, необходимого для изучения объекта. Отличительное свойство систем дуального управления заключается в зависимости этого интервала от стратегии управляющего устройства.
Постановка задачи управления. Сформулируем задачу построения оптимального управляющего устройства относительным движением КАН [2]. Рассмотрим дискретнонепрерывную систему управления, структурная схема которой представлена на рисунке.

x*s

h*s H*

y*s

gs zs

A

us G vs

B

xs

P(y*s | x*s )

Γs (Us | Us−1 , Ys−1 , Ys* )

P(vs |us )

ys hs H

P(ys |xs )
Информация x*s о параметрах относительного положения КАН поступает на вход его управляющего устройства A через канал H * , где смешивается с шумом h*s . Поэтому фактическая информация y*s , подступающая непосредственно на вход устройства А, не соответствует действительной информации x*s . Аналогично происходит смешение сигнала xs о состоянии управляемого объекта В с шумом hs в канале Н. Последний находится в цепи

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 7

32 М. Г. Кудинов, С. Б. Силантьев, А. В. Степовой

обратной связи; его выходной сигнал ys поступает на вход управляющего устройства А. Далее, управляющее воздействие us поступает на вход объекта В, также пройдя канал G , где оно смешивается с шумом gs . Поэтому действительное управляющее воздействие vs , непо-
средственно поступающее на объект В, вообще говоря, не равно воздействию us . Здесь zs — помеха, действующая на управляемый объект В.
Все величины, принятые в схеме, рассматриваются лишь в дискретные моменты времени t = 0, 1, ..., n , где n фиксировано. Значение любой из величин в момент времени
t = s снабжено индексом s (например, x*s , xs , ys и т.д.). Введем временные векторы
( )Us = (u0 , u1, ..., us ), X*s = x*0 , x1*, ..., x*s ;

( )Vs = ( v0 , v1, ..., vs ), Ys* = y*0 , y1*, ..., y*s ;

Xs = (x0 , x1, ..., xs ), Ys = (y0 , y1, ..., ys ) ,
0 ≤ s ≤ n. Значение us представляет собой случайную функцию от параметров yi , поступивших на вход устройства А в предыдущие моменты времени ( i < s ), также us есть функция значений y*j , j < s . Наконец, us может зависеть и от значений uν на выходе устройства А, полу-
ченных ранее ( ν < s ). Предыдущие значения uν могут запоминаться в этом устройстве и поступать на вход вычислительного блока, определяющего текущее значение us , точно так же как поступают на вход устройства А остальные входные параметры yi и y*j .
Задача состоит в определении оптимальной случайной стратегии устройства А, т.е. определении оптимальных плотностей вероятности

Ps (us ) = Гs (us | Us−1, Ys−1, Ys* ), 0 ≤ s ≤ n ,

при которых полный риск R минимален.

Полный риск R определяется как математическое ожидание функции потерь:

nn
R = M{W} = ∑ M{Ws} = ∑ Rs , s=0 s=0
где Rs — средний удельный риск; W — общая функция потерь, определяемая как

W

=

n
∑

Ws

(s,

xs

,

x*s

)

;

Ws

= Ws (s, xs , x*s )

— удельная

функция потерь.

s=0

Метод управления. Так как Гs есть плотность вероятности, то Гs ≥ 0 , и функции Гs

должны удовлетворять ограничению

∫ Гs (us )dΩ = 1,
Ω(us )

где Ω(us ) — область возможных значений us , d Ω — ее бесконечно малый элемент.

Назовем Гi , i = 0, 1, ..., n , удельными стратегиями.

Первый этап решения задачи состоит в выводе формулы для риска R . Найдем сначала

выражение для условного удельного риска rs , который определим как слагаемое риска, соот-

ветствующее s-му такту (т.е. моменту времени t = s ), при фиксированных значениях входных

сигналов управляющего устройства А.

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 7

Управление относительным движением КА при наблюдении орбитальных объектов

33

Условный удельный риск вычисляется по формуле [3]

rs

=

Ω(Λ

,

∫
Μ,

xs

,

us

)

Ws

[

s,

x*s

(

s,

Λ),

x

s

]

P(Λ)P(Ys* P(Ys* )

|

Λ)

P(xs

| Μ, s,us ) ×

s−1

×

P(Μ)∏ P(yi | Μ,i,ui i=0 P(Ys−1, Us−1 | Ys* )

)

s
∏
i=0

Гi

d

Ω,

где Μ = (µ1, ..., µm ) и Λ = (λ1, ..., λq ) — случайные векторы.

(1)

Пусть P(Ys*, Us−1, Ys−1) — совместная плотность распределения векторов Ys* , Us−1 и Ys−1 . Тогда средний удельный риск Rs , являющийся средним значением условного удельного риска rs , определяется формулой

Учтем теперь, что

Rs = ∫ rs P(Ys*, Us−1, Ys−1) dΩ . Ω( Ys* ,U s −1 ,Ys −1 )

(2)

P(Ys*, Us−1, Ys−1) = P(Ys−1, Us−1 | Ys* )P(Ys* ) . Подставив выражения (1) и (2) в формулу (3), с учетом

(3)

P(Ys*

|

Λ)

=

s
∏

P(y*i

|

Λ)

=

s
∏

P(y*i

|

i,

Λ)

i=0 i=0

получим основную формулу — выражение для Rs в виде

Rs = ∫ Ws [s, x*s (s, Λ), xs ]P(Λ) ⎢⎡∏s P(y*i | i, Λ)⎥⎤ P(xs | Μ, s, us ) ×

Ω(Λ,Μ, xs , Ys*,Us ,Ys−1)

⎣i=0 ⎦

×P(Μ) ⎢⎡∏s−1 P(yi

|

Μ, i, ui

)⎤⎥

⋅ ⎡⎢∏s Гi

⎤ ⎥

dΩ.

⎣i=0 ⎦ ⎣i=0 ⎦

Управление при t = k ( k < n ) должно быть направлено не только на уменьшение значе-

ния Rk — удельного риска, но и на уменьшение значений рисков Ri ( i > k ) в последующие моменты времени путем лучшего изучения объекта. Рассмотрим Sk — составляющую полно-

го риска R , зависящую от стратегии Гk :

nn
Sk = ∑ Ri = Rk + ∑ Ri .

(4)

i=k i=k +1

По отношению к удельной стратегии Гk первое слагаемое правой части выражения (4)

можно назвать риском действия, а второе — риском изучения. Примитивная стратегия, опре-

деляющая воздействие uk (или его плотность вероятности Гk ), так чтобы минимизировать лишь риск действия, не является оптимальной. С другой стороны, игнорирование риска дей-

ствия и минимизация лишь риска изучения, т. е. выбор uk (либо Гk ) лишь с целью наилуч-
шего изучения объекта для использования этой информации в последующих действиях, также не будет оптимальным поведением. Оптимальная стратегия при дуальном управлении

должна минимизировать сумму Sk рисков действия и изучения.
При определении оптимальной стратегии дуального управления воспользуемся методом динамического программирования [4].

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 7

34 М. Г. Кудинов, С. Б. Силантьев, А. В. Степовой

Оптимальная стратегия Г*n (для фиксированного момента времени п) определяется выражением

Г*n = δ(un − u*n ) , где δ — единичная импульсная функция.

(5)

Величина u*n представляет собой функцию от Un−1 , Yn−1 , Yn* :

u*n = u*n (Un−1, Yn−1, Yn* ) .

(6)

Это означает, что Г*n является регулярной стратегией, причем в соответствии с выраже-

нием (6) оптимальное значение un равно u*n . Как следует из выражения (6), u*n представляет

собой функцию от ранее поступивших на управляющее устройство А сигналов us , ys ,

s = 0,1, ..., n −1, а также параметров y*i , i = 0,1, ..., n .

Оптимальная стратегия Г*n−k (для некоторого момента времени n − k ), определяемая выражением

Г*n−k = δ(un−k − u*n−k ) , где

u*n−k = u*n−k (Yn*−k , Un−k −1, Yn−k−1) ,

(7)

регулярна и заключается в выборе un−k = u*n−k согласно формуле (7). Как видно из этой фор-

мулы, оптимальное управление u*n−k в момент t = n − k зависит, вообще говоря, от предыстории изменения входных сигналов, поступающих на устройство А, т.е. от всех значений ui и

yi , i = 0,1, ..., n − k −1, а также от значений y*j , j ≤ n − k . При этом начальное управляющее

воздействие u*0 = u*0 (y*0 ) зависит от исходной информации, полученной на входе устройства
А, и от априорных данных. Следует отметить, что в оптимальном алгоритме (7), который должен быть заложен в

управляющее устройство А, значение u*n−k зависит от параметров ui , yi , y*i , поступивших на
вход устройства А в прошлом, а также от текущего значения y*n−k , но не от будущих значений этих параметров. Поэтому оптимальное управляющее устройство физически реализуемо.

Заключение. Экспериментальные исследования предложенного метода были проведены путем математического моделирования управляемого относительного движения КАН и

наблюдаемого орбитального объекта. Их орбиты принимались круговыми компланарными. В результате моделирования было установлено, что минимальное количество управ-
ляющих воздействий равно двум; первое управляющее воздействие должно быть направлено по перпендикуляру к линии визирования; параметры последующих управляющих воздействий выбираются исходя из конкретного вида относительного маневра (облет, зависание, барражирование и т.д.).

СПИСОК ЛИТЕРАТУРЫ
1. Гончаревский В. С. Методы и алгоритмы управления относительным движением космических аппаратов. МО РФ, 1998. 87 с.
2. Фельдбаум А. А. Теория дуального управления // Автоматика и телемеханика. 1960. Т. 21, № 9. С. 1240—1249.
3. Фельдбаум А. А. Основы теории оптимальных автоматических систем. М.: Наука, 1966. 629 с.
4. Бесекерский В. А., Попов Е. П. Теория систем автоматического регулирования. М.: Наука, 1972. С. 385—389.

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 7

Анализ перекрестных связей в динамических системах класса „двумерный вход — выход“ 35

Михаил Георгиевич Кудинов — Сергей Борисович Силантьев — Андрей Васильевич Степовой —

Сведения об авторах Военно-космическая академия им. А. Ф. Можайского, кафедра автономных систем управления, Санкт-Петербург; мл. науч. сотрудник; E-mail: kudinov.m@gmail.com канд. техн. наук, доцент; Военно-космическая академия им. А. Ф. Можайского, кафедра автономных систем управления, Санкт-Петербург; E-mail: silantev2008@yandex.ru канд. техн. наук; КБ точного машиностроения им. А. Э. Нудельмана, Москва; E-mail: kbtm2@tochmash.rmt.ru

Рекомендована кафедрой автономных систем управления ВКА

Поступила в редакцию 02.03.09 г.

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 7