For example,Бобцов

OPTIMAL CONTROL OVER NUCLEAR REACTOR WITH THE ACCOUNT FOR RANDOM DISTURBANCES

Оптимальное управление ядерным реактором с учетом случайных возмущений

27

УДК 62-50

Д. С. КАБАНОВ
ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЯДЕРНЫМ РЕАКТОРОМ С УЧЕТОМ СЛУЧАЙНЫХ ВОЗМУЩЕНИЙ

Рассматривается задача оптимального управления ядерным реактором по неполным данным. Решение основано на принципе разделения с использованием фильтра Калмана и алгоритма оптимального управления по принципу максимума. Приведены результаты численного моделирования, которое позволило установить начальные значения параметров краевой задачи, обеспечивающие сходимость итерационной процедуры при воздействии случайных возмущений.

Ключевые слова: оптимальная фильтрация, управление по принципу максимума, метод Ньютона.

Решение задачи оптимального управления такой сложной системой, как ядерный реак-

тор связано с трудностями, обусловленными необходимостью решения двухточечной краевой

задачи. При решении по неполным данным терминальной задачи управления ядерным реак-

тором, модель которого описывает одиночную группу медленных нейтронов [1, 2], требуется

увеличить плотность потока нейтронов от исходного состояния до заданного конечного в

фиксированный момент времени при минимальных затратах на управление. Использование

принципа разделения и классических целевых функционалов позволяет свести алгоритм

управления к уравнениям фильтра Калмана и решению двухточечной краевой задачи. Реше-

ние этой задачи связано с итерационной процедурой, сходимость которой существенно зави-

сит от выбора начальных значений параметров краевой задачи [1, 3]. В результате примене-

ния метода Ньютона для решения этой задачи разработан алгоритм управления и рассмотре-

ны варианты задачи с фиксированным и свободным правым концом [1, 3, 4].

Рассмотрим модель ядерного реактора в виде кинетических уравнений для размножения

медленных нейтронов [1]:

x = f (x, u, t)+ξx ;

(1)

f (x, u,t) = ( f1, f2 )T ,

f1

=



−β)n Λ

+

λc

,

f

2

=

β Λ

n



λc

,

где x = (n, c)T — вектор состояния системы; n — поток нейтронов; c — поток возбужденных

радиоактивных ядер; ρ — реактивность (принимается за управление); β — доля запаздываю-

щих нейтронов деления по отношению к мгновенным нейтронам деления; Λ — эффективное

время жизни нейтронов; λ — постоянная распада для возбужденных ядер; ξx =[ξxn , 0]T ,

ξxn — случайные возмущения типа белого шума с интенсивностью Bxn = σ2xn . Величины β , Λ , λ считаются постоянными, а начальные значения переменных n и с заданными.

Уравнение наблюдения имеет вид

z = Gx+ξz ,

(2)

где z = zn — вектор измерений параметров наблюдаемого процесса; G = (1 0) ; ξz = ξn — случайный процесс типа белого шума с интенсивностью Bz = Bzn = σ2zn .
Требуется увеличить поток нейтронов от исходного состояния n(t0 ) до заданного конечного n f в момент времени t f при минимальных затратах на управление.

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 5

28 Д. С. Кабанов

Задача рассматривалась в двух постановках:

1) с заданным граничным условием n(t f ) = n f при минимизации функционала Лагранжа

tf
I = 0,5 ∫ γρ2dt ; t0
2) с целевым функционалом Больца

∫I

= 0,5α

⎡⎣n(t f

)−nf

⎦⎤2

tf
+0, 5

γρ2 dt

,

t0

здесь α, γ — заданные коэффициенты.

В соответствии с принципом разделения задаче управления предшествует задача оценивания вектора состояния системы по неполным данным, которые определяются уравнением (2).
Оптимальную оценку вектора х можно вычислить с помощью фильтра Калмана [1, 3], уравнения которого для данной задачи имеют следующий вид:

n

=

ρ−β Λ

n

+

λc

+

R11σ−zn2

(

zn



n

);

c

=

β Λ

n



λc

+

R21σ−zn2

(

zn



n);

⎫ ⎪ ⎪⎪ ⎬ ⎪

R

=

f

x

R

+

Rf

T x

− RGT

Bz−1GR+ Bx ,

R(t0 ) =

R0

,

⎪ ⎪⎭

(3)

здесь

f

x

=

∂f ∂x

;

R0 (1,1) = 9σ2xn ;

Bx = diag(Bxn , 0); остальные элементы матрицы начальных ко-

вариаций ошибок оценивания принимались равными нулю.

Для решения второй части задачи — выбора оптимального управления по принципу

максимума — полагаем, что вектор состояния известен точно и равен вектору оценок состоя-

ния, определенному в системе (3). Чтобы вывести уравнения, составляющие алгоритм управ-

ления по принципу максимума, запишем гамильтониан задачи

H

(

x,

u,

t

)

=

pn

⎜⎝⎛

ρ−β Λ

n

+

λc

⎞⎟⎠+

pc

⎝⎛⎜

βn Λ



λc

⎠⎞⎟

+

0,

5γρ2

.

Уравнения для сопряженных переменных p = ( pn , pc )T имеют вид [1—3]

p n

=



∂H ∂n

=−

pn

ρ−β Λ



pc

β Λ

,

p c

=−

∂H ∂c

=



pn λ +

pc λ

(4)

при граничных условиях pn (t f ) = α ⎡⎣n(t f )−n f ⎦⎤ (для второго варианта постановки задачи). Управление определяется из условия ∂H = 0 как ∂ρ

ρ(t )

= −γ−1

n(t) Λ

pn

(t).

Двухточечную краевую задачу для уравнений (1), (4) при соответствующих граничных условиях решим методом Ньютона. Для этого введем вектор невязок Φ = (Φ1, Φ2 )T , Φ1 = n(t f )−n f , Φ2 = n(t f )−n f , неявным образом зависящий от параметров краевой задачи:
r = ( pn (t0 ), pc (t0 ))T , здесь n(t f ) = f1(t f ).

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 5

Оптимальное управление ядерным реактором с учетом случайных возмущений

29

Значения вектора r вычисляются по следующему рекуррентному соотношению: ri+1 = ri +∆r , ∆r = −sΦ−r 1Φ , где матрица частных производных Φr и обратная ей матрица Φr−1 задаются выражениями

Φr

=

⎡Φ1n ⎣⎢Φ2n

Φ1c Φ2c

⎤ ⎥ ⎦

;

Φr−1

=

1 ∆

⎡Φ2c ⎢⎣−Φ2n

−Φ1c Φ1n

⎤ ⎥ ⎦

,

где

Φ1n

=

∂Φ1 ∂pn

,

Φ1c

=

∂Φ1 ∂pc

,

Φ2n

=

∂Φ2 ∂pn

,

Φ2c

=

∂Φ2 ∂pc

;



— определитель матрицы

Φr .

Ввиду неявной зависимости вектора Φ от вектора r матрица частных производных Φr

находится численно. Скалярный множитель s∈(0, 1] выбирается на каждой итерации исходя из

условия

Φ(ri+1) < Φ(ri ) ,

Φ(r) =

Φ12

+

Φ

2 2

.

При

достижении

требований

по

точности

решения

задачи управления Φ(ri+1) < ε ( ε >0 — заданная малая величина) итерации прекращаются.
Вначале расчет производился для детерминированного случая в целях нахождения таких значений вектора r , при которых обеспечивается устойчивая сходимость итерационной

процедуры. Задача решалась при n(t0 ) = 0, 5 кВт, с(t0 ) = 32 кВт, ρ(t0 ) = 0 , β = 0,0064, Λ =10−3 c, λ = 0,1c–1, при этом требуемые значения следующие: n f = 5 кВт, n f = 0. Для ин-

тервала оптимизации t f −t0 =1 c, шага численного интегрирования по методу Рунге — Кутты

∆t = 0,1 c, ε = 0,1 , γ =1000 получены следующие результаты при r = (−0, 004; −0, 001)T :

n(t f ) = 5, 021 кВт, n(t f ) = 0, 066 кВт/с (за 3 итерации).

Для второго варианта постановки задачи с целевым функционалом Больца при тех же

значениях вектора r и вектора невязок с компонентами Φ1 = pn (t f )−α[n(t f )−n f ],

Φ2 = n(t f )−n f приемлемые результаты были получены при α = 0, 000 006 , ε = 0, 01:

n(t f ) = 5, 056 кВт, n(t f ) = 0, 000 028 кВт/с (за 12 итераций).

Решение задачи во втором варианте оказалось менее устойчивым к выбору параметров

алгоритма, поэтому для решения задачи при воздействии возмущений ξx , ξz был выбран пер-
вый вариант постановки. Сравнение полученного решения с результатами применения алгоритма последовательной оптимизации [4] по иерархии целевых функционалов показало [2], что достижение реактором заданной конечной величины n(f) потока нейтронов осуществля-

ется посредством управления ρmax =8,86⋅103 , тогда как в работе [2] ρmax =14⋅103 . Кроме того, достигнута более высокая точность конечного значения производной n(t f ) = 0 (в работе [2]

значение n(t f ) = 0,5 кВт/с зависит от точности итерационной процедуры подстройки модели

прогнозирования). Преимущество алгоритма, рассмотренного в работе [2], заключается в малом объеме вычислений, что позволяет формировать управление в реальном времени динамики процесса.
Совместное решение задач фильтрации и управления выявило существенный недостаток рассмотренного в настоящей статье решения, обусловленный необходимостью задания параметров двухточечной краевой задачи, достаточно близких к точным значениям. Поэтому

при расчете на интервале t∈[0; 0,9] с для обеспечения сходимости итерационной процедуры

шаг численного моделирования (∆t) принимался равным 0,02 c, а в конце расчета при

t∈(0,9; 1] с составил ∆t = 0, 01 c. Вычисления производились при следующих характеристиках

случайных процессов (среднеквадратических отклонениях): σxn = 0,1 кВт/с, σzn = 0, 3 кВт.

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 5

30 Д. С. Кабанов Получены следующие результаты: n(t f ) = 5, 025 кВт, n(t f ) = 5, 01 кВт. Как видно, численное
моделирование подтвердило возможность решения задачи оптимального управления стохастической моделью ядерного реактора по неполным данным с использованием принципа разделения.
Исследования, описанные в настоящей статье, выполнены по гранту Российского фонда фундаментальных исследований, № 09-08-00829.

СПИСОК ЛИТЕРАТУРЫ

1. Сейдж Э. П., Уайт Ч. С. Оптимальное управление системами. М.: Радио и связь, 1982. 392 с.

2. Kabanov D., Kabanov S. Application of algorithm of forecasting model to the optimal control of nuclear reactor // Proc. 4th MathMOD, 5—7 Febr., 2003, Vienna. Full Papers CD. Vol. 2. P. 1466—1471.

3. Справочник по теории автоматического управления / Под ред. А. А. Красовского. М.: Наука, 1987. 712 с.

4. Кабанов С. А. Управление системами на прогнозирующих моделях. СПб.: Изд-во СПбГУ, 1997. 200 с.

Дмитрий Сергеевич Кабанов

Сведения об авторе — ГНПП „Регион“, Москва; инженер; E-mail: kabanovds@mail.ru

Рекомендована кафедрой систем обработки информации и управления БГТУ „ВОЕНМЕХ“, Санкт-Петербург

Поступила в редакцию 07.12.07 г.

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 5