Например, Бобцов

РЕГУЛЯРИЗАЦИЯ ВАРИАЦИОННЫХ ОЦЕНОК ПАРАМЕТРОВ СОСТОЯНИЯ НЕЛИНЕЙНЫХ ДИНАМИЧЕСКИХ СИСТЕМ

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ И СИСТЕМЫ
УДК 629.191
В. И. МИРОНОВ, Ю. В. МИРОНОВ, Р. М. ЮСУПОВ
РЕГУЛЯРИЗАЦИЯ ВАРИАЦИОННЫХ ОЦЕНОК ПАРАМЕТРОВ СОСТОЯНИЯ НЕЛИНЕЙНЫХ ДИНАМИЧЕСКИХ СИСТЕМ
Рассматриваются методические аспекты применения вариационного подхода для регуляризации решения задач статистического оценивания параметров состояния нелинейных динамических систем по критерию максимального правдоподобия при дискретных измерениях.
Ключевые слова: статистическое оценивание, регуляризация, нелинейные динамические системы, критерий максимального правдоподобия.
Введение. Разработка, испытания и эксплуатация образцов авиационной и ракетнокосмической техники, а также других сложных автоматических и автоматизированных систем и комплексов различного целевого назначения часто связаны с решением задач оценивания параметров состояния и характеристик динамических систем по результатам измерений.
Наиболее сложные задачи оценивания приходится, в частности, решать при навигационно-баллистическом обеспечении полетов космических аппаратов (КА), при разработке систем автономной навигации, в ходе летных испытаний и др.
На практике нередко возникают ситуации, связанные с недостаточной наблюдаемостью или обусловленностью задач статистического оценивания. Эффективным средством решения таких задач является метод регуляризации, предложенный А. Н. Тихоновым для решения некорректных обратных задач и развитый во многих работах [1—4 и др.].
Методология решения задач такого рода предусматривает формирование так называемого стабилизирующего функционала и в основном базируется на непосредственном применении в динамических задачах оценивания прямых условий метода максимального правдоподобия (ММП) и метода наименьших квадратов [1, 2, 5—7 и др.].
Вместе с тем необходимо отметить, что создание и развитие методов, применяемых в теории оптимальной обработки измерений, как и в теории оптимального управления, может быть основано на использовании вариационных условий оптимальности статистических оценок. В работах [8—11 и др.] были рассмотрены вопросы обоснования вариационного подхода к задачам статистического оценивания нелинейных динамических систем. Настоящая статья посвящена методическим аспектам применения вариационного подхода для регуляризации решения плохо обусловленных задач статистического оценивания параметров состояния нелинейных динамических систем по критерию максимального правдоподобия при дискретных измерениях.
Постановка задачи. Рассмотрим задачу оценивания параметров движения динамического объекта, которая заключается в определении по некоторому критерию п-мерного вектора его исходного состояния x0 на заданный начальный момент времени t = t0 по результатам
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2012. Т. 55, № 1

6 В. И. Миронов, Ю. В. Миронов, Р. М. Юсупов
измерений, проводимых в N точках, заданных на интервале измерений τ = T − t0 . Пусть динамика объекта описывается векторным дифференциальным уравнением
x = φ(x,t), x(t0 ) = x0 , t ∈[t0 ,T ] .
Определяется m-мерный вектор
ψ(t) = ψ[x(t)] .

Измеренное значение вектора ψ в момент ti обозначим как y(ti ) = yi и представим модель измерений в виде
y(ti ) = ψ[x(ti )] + δi , i = 1(1)N , ti ∈[t0 ,T ] .

Здесь δi — m-мерный вектор случайных ошибок измерений, стохастическое изменение кото-

рого зададим некоторым многомерным непрерывным дифференцируемым распределением

f (δi , αi ) с параметрами αi , отличающимся в общем случае от нормального распределения.

При выполнении известных условий наблюдаемости (хорошей обусловленности) требу-

ется найти такую оценку вектора x0 , которая обеспечивает минимальное значение функцио-

нала

N

I = ∑ ρi {y(ti ), ψ[x(ti )], αi } ,

(1)

i=1

где

ρi = − ln fi {y(ti ) − ψ[x(ti ), αi ]} , i = 1(1)N .

Функции φ(x,t) и ψ[x(ti )] будем считать однозначными, ограниченными, непрерыв-
ными и дифференцируемыми по всем аргументам во всей области их определения. Очевидно, что функционал (1) есть не что иное, как логарифмическая функция правдо-
подобия. Вариационные условия оптимальности оценок. Для решения указанной задачи в ра-
боте [9] с использованием традиционных приемов вариационного исчисления определены условия оптимальности оценок вариационного типа, которые сформулированы следующим образом.
Оптимальная оценка вектора x0 и порождаемая ею оптимальная траектория x(x0,t)
доставляют решение двухточечной краевой задаче для канонической системы

x = φ(x,t) ,

λ

=



∂φT ∂x

λ

(2)

при граничных условиях

λ(t0 ) = 0 ;

λ(T ) = 0 ;

λ(ti+

)

=

λ(ti−

)

+

∂ρ ∂x

[yi

,

ψ(xi

), ti

]T

,

(3)

где λ — п-мерная вектор-функция сопряженных переменных. Таким образом, рассматриваемую задачу можно интерпретировать как двухточечную
краевую задачу с промежуточными ограничениями на значение сопряженного вектора λ(t) .
Приведенные условия оптимального оценивания (2), (3) нетрудно конкретизировать применительно к заданному виду распределения вектора случайных ошибок измерений.
Так, если для вектора δi принимается нормальное распределение N (0, Kδi ) с нулевым
вектором математического ожидания и корреляционной матрицей Kδi , что, как правило,

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2012. Т. 55, № 1

Регуляризация вариационных оценок параметров

7

имеет место на практике, решение задачи оптимального оценивания сводится к решению

краевой задачи

x = φ(x,t) ,

λ

=



∂φT ∂x

λ;

(4)

λ(t0 ) = 0 ;

λ(T ) = 0 ;

λ(ti+ )

=

λ(ti− ) +

∂ψT ∂x

{K

−1 δi

yi

− ψ[x(ti )]} ,

i

= 1(1)N

.

(5)

Регуляризация оптимальных статистических оценок. В случае плохой обусловлен-

ности исходной задачи в соответствии с методом регуляризации [3] в качестве ее приближен-

ного решения следует принять такое значение вектора x0 , на котором сглаживающий функ-

ционал

Iα = I (x0 ) + α F(x0 )

(6)

принимает экстремальное значение. Выбор стабилизирующего функционала (стабилизатора) F (x0 ) определяется характером
решаемой задачи и обычно основан на априорной информации об искомых параметрах x0 . Параметр регуляризации α > 0 также должен быть определенным образом согласован и с априорными данными о векторе x0 , и с характеристиками ошибок измерений.
Необходимые условия оптимальности регуляризированных оценок вариационного типа применительно к функционалу Iα (6) могут быть определены аналогично рассмотренным в работе [9], либо на основе анализа и использования вариационных условий оптимальности, приведенных выше.
Действительно, применение функционала (6) эквивалентно дополнению к функционалу (1) слагаемого
ρ0[x(t0 )] = α F (x0 ) .

Тогда в системе условий (4), (5) появляется дополнительное граничное условие

λ(t0+ ) = λ(t0− ) +

∂ρ0 (x0 )T ∂x0

.

Так как, согласно условиям (5), λ(t0− ) = 0 , то при регуляризации оптимальных оценок

интегрирование сопряженной системы должно проводиться при начальном условии

λ(t0

)

=

∂ρ0 (x0 )T ∂x0

=

α

∂F (x0 ∂x0

)T

.

Соответствующий результат сформулируем применительно к нормальному закону рас-

пределения ошибок измерений в виде следующей теоремы.

Теорема. Регуляризированная оценка вектора x0 и порождаемая ею регуляризирован-

ная траектория x(x0,t) доставляют решение двухточечной краевой задаче для канонической

системы

x = φ(x,t) ,

λ

=



∂φT ∂x

λ

(7)

при граничных условиях

λ(t0

)

=

α

∂F (x0 ∂x0

)T

;

λ(T ) = 0 ;

λ(ti+

)

=

λ(ti−

)

+

∂ψT (ti ∂xi

)

{K

−1 δi

yi



ψ[x(ti

)]} ,

i = 1(1)N .

(8)

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2012. Т. 55, № 1

8 В. И. Миронов, Ю. В. Миронов, Р. М. Юсупов

Полученные условия оптимальности можно конкретизировать для типовых задач, связанных с определением регуляризированных оценок при различных структурах стабилизато-
ра F (x0 ) .
В частности, при решении задач навигационного оценивания обычно для стабилизирующего функционала принимается выражение следующего вида [2]:

α

F (x0

)

=

1 2

(xb



x0

)T

C (xb



x0 )

,

где xb — заданный опорный вектор, близкий к истинному значению x0 ; C — некоторая симметрическая положительно-определенная матрица.
В этом случае начальное значение сопряженного вектора λ(t0 ) по условиям (8) определяется в соответствии с расчетным соотношением:

λ(t0 ) = C (x0 − xb ) .

Для поиска оптимальных регуляризированных оценок можно использовать известные методы численного решения краевых задач (метод Ньютона, градиентные методы, их модификации, метод приближенного корректирующего оператора [10] и др.).
В заключение отметим, что предлагаемые методические средства могут быть использованы при разработке и модернизации алгоритмов оптимального оценивания параметров состояния нелинейных динамических объектов различных типов в составе автоматизированных комплексов обработки наблюдений.

Работа выполнена при поддержке Российского фонда фундаментальных исследований, проект № 09-08-00259.

СПИСОК ЛИТЕРАТУРЫ
1. Статистические методы обработки результатов наблюдений / Под ред. Р. М. Юсупова. М.: МО СССР, 1984. 563 с.
2. Степанов М. Г. Введение в теорию смещенного оценивания параметров движения космических аппаратов по ограниченным данным. СПб: ВИККА им. А. Ф. Можайского, 1993. 135 с.
3. Тихонов А. Н., Арсенин В. Я. Методы решения некорректных задач. М.: Наука, 1979. 288 с.
4. Тихонов А. Н., Гончарский А. В., Степанов В. В., Ягола А. Г. Регуляризирующие алгоритмы и априорная информация. М.: Наука, 1983. 200 с.
5. Линник Ю. В. Метод наименьших квадратов и основы теории обработки наблюдений. М.: Физматгиз, 1958. 350 с.
6. Репин В. Г., Тартаковский Г. П. Статистический синтез при априорной неопределенности и адаптация информационных систем. М.: Сов. радио, 1977. 432 с.
7. Эльясберг П. Е. Определение движения по результатам измерений. М.: Наука, 1976. 416 с.
8. Миронов В. И., Миронов Ю. В., Юсупов Р. М. Адекватность прямого и вариационного подходов в задачах оценивания состояния нелинейных динамических систем при гауссовских ошибках измерений // Мехатроника, автоматизация, управление. 2010. № 11. С. 9—11.
9. Миронов В. И., Миронов Ю. В., Юсупов Р. М. Вариационное оценивание состояния нелинейной динамической системы по критерию максимального правдоподобия // Там же. 2009. № 11. С. 2—6.
10. Миронов В. И., Миронов Ю. В., Юсупов Р. М. Метод наименьших квадратов в задачах вариационного оценивания состояния нелинейных динамических систем // Информационно-управляющие системы. 2009. № 6. С. 2—6.
11. Миронов В. И., Миронов Ю. В., Юсупов Р. М. Синтез итерационных алгоритмов решения краевых задач и нелинейных уравнений // Изв. вузов. Приборостроение. 2010. Т. 53, № 1. С. 9—14.

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2012. Т. 55, № 1

Исследование алгоритмов выбора опорных пикселов

9

Вячеслав Иванович Миронов
Юрий Вячеславович Миронов Рафаэль Мидхатович Юсупов

Сведения об авторах — д-р техн. наук, профессор; Санкт-Петербургский институт информа-
тики и автоматизации РАН; вед. науч. сотрудник; E-mail: mironuv@yandex.ru — д-р техн. наук; Санкт-Петербургский институт информатики и автоматизации РАН; ст. науч. сотрудник; E-mail: mironuv@yandex.ru — д-р техн. наук, профессор; Санкт-Петербургский институт информатики и автоматизации РАН; директор; E-mail: spiiran@iias.spb.su

Рекомендована СПИИРАН

Поступила в редакцию 02.08.11 г.

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2012. Т. 55, № 1