OPTIMAL CONTROL OVER NUCLEAR REACTOR WITH THE ACCOUNT FOR RANDOM DISTURBANCES
Оптимальное управление ядерным реактором с учетом случайных возмущений
27
УДК 62-50
Д. С. КАБАНОВ
ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЯДЕРНЫМ РЕАКТОРОМ С УЧЕТОМ СЛУЧАЙНЫХ ВОЗМУЩЕНИЙ
Рассматривается задача оптимального управления ядерным реактором по неполным данным. Решение основано на принципе разделения с использованием фильтра Калмана и алгоритма оптимального управления по принципу максимума. Приведены результаты численного моделирования, которое позволило установить начальные значения параметров краевой задачи, обеспечивающие сходимость итерационной процедуры при воздействии случайных возмущений.
Ключевые слова: оптимальная фильтрация, управление по принципу максимума, метод Ньютона.
Решение задачи оптимального управления такой сложной системой, как ядерный реак-
тор связано с трудностями, обусловленными необходимостью решения двухточечной краевой
задачи. При решении по неполным данным терминальной задачи управления ядерным реак-
тором, модель которого описывает одиночную группу медленных нейтронов [1, 2], требуется
увеличить плотность потока нейтронов от исходного состояния до заданного конечного в
фиксированный момент времени при минимальных затратах на управление. Использование
принципа разделения и классических целевых функционалов позволяет свести алгоритм
управления к уравнениям фильтра Калмана и решению двухточечной краевой задачи. Реше-
ние этой задачи связано с итерационной процедурой, сходимость которой существенно зави-
сит от выбора начальных значений параметров краевой задачи [1, 3]. В результате примене-
ния метода Ньютона для решения этой задачи разработан алгоритм управления и рассмотре-
ны варианты задачи с фиксированным и свободным правым концом [1, 3, 4].
Рассмотрим модель ядерного реактора в виде кинетических уравнений для размножения
медленных нейтронов [1]:
x = f (x, u, t)+ξx ;
(1)
f (x, u,t) = ( f1, f2 )T ,
f1
=
(ρ
−β)n Λ
+
λc
,
f
2
=
β Λ
n
−
λc
,
где x = (n, c)T — вектор состояния системы; n — поток нейтронов; c — поток возбужденных
радиоактивных ядер; ρ — реактивность (принимается за управление); β — доля запаздываю-
щих нейтронов деления по отношению к мгновенным нейтронам деления; Λ — эффективное
время жизни нейтронов; λ — постоянная распада для возбужденных ядер; ξx =[ξxn , 0]T ,
ξxn — случайные возмущения типа белого шума с интенсивностью Bxn = σ2xn . Величины β , Λ , λ считаются постоянными, а начальные значения переменных n и с заданными.
Уравнение наблюдения имеет вид
z = Gx+ξz ,
(2)
где z = zn — вектор измерений параметров наблюдаемого процесса; G = (1 0) ; ξz = ξn — случайный процесс типа белого шума с интенсивностью Bz = Bzn = σ2zn .
Требуется увеличить поток нейтронов от исходного состояния n(t0 ) до заданного конечного n f в момент времени t f при минимальных затратах на управление.
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 5
28 Д. С. Кабанов
Задача рассматривалась в двух постановках:
1) с заданным граничным условием n(t f ) = n f при минимизации функционала Лагранжа
tf
I = 0,5 ∫ γρ2dt ; t0
2) с целевым функционалом Больца
∫I
= 0,5α
⎡⎣n(t f
)−nf
⎦⎤2
tf
+0, 5
γρ2 dt
,
t0
здесь α, γ — заданные коэффициенты.
В соответствии с принципом разделения задаче управления предшествует задача оценивания вектора состояния системы по неполным данным, которые определяются уравнением (2).
Оптимальную оценку вектора х можно вычислить с помощью фильтра Калмана [1, 3], уравнения которого для данной задачи имеют следующий вид:
n
=
ρ−β Λ
n
+
λc
+
R11σ−zn2
(
zn
−
n
);
c
=
β Λ
n
−
λc
+
R21σ−zn2
(
zn
−
n);
⎫ ⎪ ⎪⎪ ⎬ ⎪
R
=
f
x
R
+
Rf
T x
− RGT
Bz−1GR+ Bx ,
R(t0 ) =
R0
,
⎪ ⎪⎭
(3)
здесь
f
x
=
∂f ∂x
;
R0 (1,1) = 9σ2xn ;
Bx = diag(Bxn , 0); остальные элементы матрицы начальных ко-
вариаций ошибок оценивания принимались равными нулю.
Для решения второй части задачи — выбора оптимального управления по принципу
максимума — полагаем, что вектор состояния известен точно и равен вектору оценок состоя-
ния, определенному в системе (3). Чтобы вывести уравнения, составляющие алгоритм управ-
ления по принципу максимума, запишем гамильтониан задачи
H
(
x,
u,
t
)
=
pn
⎜⎝⎛
ρ−β Λ
n
+
λc
⎞⎟⎠+
pc
⎝⎛⎜
βn Λ
−
λc
⎠⎞⎟
+
0,
5γρ2
.
Уравнения для сопряженных переменных p = ( pn , pc )T имеют вид [1—3]
p n
=
−
∂H ∂n
=−
pn
ρ−β Λ
−
pc
β Λ
,
p c
=−
∂H ∂c
=
−
pn λ +
pc λ
(4)
при граничных условиях pn (t f ) = α ⎡⎣n(t f )−n f ⎦⎤ (для второго варианта постановки задачи). Управление определяется из условия ∂H = 0 как ∂ρ
ρ(t )
= −γ−1
n(t) Λ
pn
(t).
Двухточечную краевую задачу для уравнений (1), (4) при соответствующих граничных условиях решим методом Ньютона. Для этого введем вектор невязок Φ = (Φ1, Φ2 )T , Φ1 = n(t f )−n f , Φ2 = n(t f )−n f , неявным образом зависящий от параметров краевой задачи:
r = ( pn (t0 ), pc (t0 ))T , здесь n(t f ) = f1(t f ).
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 5
Оптимальное управление ядерным реактором с учетом случайных возмущений
29
Значения вектора r вычисляются по следующему рекуррентному соотношению: ri+1 = ri +∆r , ∆r = −sΦ−r 1Φ , где матрица частных производных Φr и обратная ей матрица Φr−1 задаются выражениями
Φr
=
⎡Φ1n ⎣⎢Φ2n
Φ1c Φ2c
⎤ ⎥ ⎦
;
Φr−1
=
1 ∆
⎡Φ2c ⎢⎣−Φ2n
−Φ1c Φ1n
⎤ ⎥ ⎦
,
где
Φ1n
=
∂Φ1 ∂pn
,
Φ1c
=
∂Φ1 ∂pc
,
Φ2n
=
∂Φ2 ∂pn
,
Φ2c
=
∂Φ2 ∂pc
;
∆
— определитель матрицы
Φr .
Ввиду неявной зависимости вектора Φ от вектора r матрица частных производных Φr
находится численно. Скалярный множитель s∈(0, 1] выбирается на каждой итерации исходя из
условия
Φ(ri+1) < Φ(ri ) ,
Φ(r) =
Φ12
+
Φ
2 2
.
При
достижении
требований
по
точности
решения
задачи управления Φ(ri+1) < ε ( ε >0 — заданная малая величина) итерации прекращаются.
Вначале расчет производился для детерминированного случая в целях нахождения таких значений вектора r , при которых обеспечивается устойчивая сходимость итерационной
процедуры. Задача решалась при n(t0 ) = 0, 5 кВт, с(t0 ) = 32 кВт, ρ(t0 ) = 0 , β = 0,0064, Λ =10−3 c, λ = 0,1c–1, при этом требуемые значения следующие: n f = 5 кВт, n f = 0. Для ин-
тервала оптимизации t f −t0 =1 c, шага численного интегрирования по методу Рунге — Кутты
∆t = 0,1 c, ε = 0,1 , γ =1000 получены следующие результаты при r = (−0, 004; −0, 001)T :
n(t f ) = 5, 021 кВт, n(t f ) = 0, 066 кВт/с (за 3 итерации).
Для второго варианта постановки задачи с целевым функционалом Больца при тех же
значениях вектора r и вектора невязок с компонентами Φ1 = pn (t f )−α[n(t f )−n f ],
Φ2 = n(t f )−n f приемлемые результаты были получены при α = 0, 000 006 , ε = 0, 01:
n(t f ) = 5, 056 кВт, n(t f ) = 0, 000 028 кВт/с (за 12 итераций).
Решение задачи во втором варианте оказалось менее устойчивым к выбору параметров
алгоритма, поэтому для решения задачи при воздействии возмущений ξx , ξz был выбран пер-
вый вариант постановки. Сравнение полученного решения с результатами применения алгоритма последовательной оптимизации [4] по иерархии целевых функционалов показало [2], что достижение реактором заданной конечной величины n(f) потока нейтронов осуществля-
ется посредством управления ρmax =8,86⋅103 , тогда как в работе [2] ρmax =14⋅103 . Кроме того, достигнута более высокая точность конечного значения производной n(t f ) = 0 (в работе [2]
значение n(t f ) = 0,5 кВт/с зависит от точности итерационной процедуры подстройки модели
прогнозирования). Преимущество алгоритма, рассмотренного в работе [2], заключается в малом объеме вычислений, что позволяет формировать управление в реальном времени динамики процесса.
Совместное решение задач фильтрации и управления выявило существенный недостаток рассмотренного в настоящей статье решения, обусловленный необходимостью задания параметров двухточечной краевой задачи, достаточно близких к точным значениям. Поэтому
при расчете на интервале t∈[0; 0,9] с для обеспечения сходимости итерационной процедуры
шаг численного моделирования (∆t) принимался равным 0,02 c, а в конце расчета при
t∈(0,9; 1] с составил ∆t = 0, 01 c. Вычисления производились при следующих характеристиках
случайных процессов (среднеквадратических отклонениях): σxn = 0,1 кВт/с, σzn = 0, 3 кВт.
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 5
30 Д. С. Кабанов Получены следующие результаты: n(t f ) = 5, 025 кВт, n(t f ) = 5, 01 кВт. Как видно, численное
моделирование подтвердило возможность решения задачи оптимального управления стохастической моделью ядерного реактора по неполным данным с использованием принципа разделения.
Исследования, описанные в настоящей статье, выполнены по гранту Российского фонда фундаментальных исследований, № 09-08-00829.
СПИСОК ЛИТЕРАТУРЫ
1. Сейдж Э. П., Уайт Ч. С. Оптимальное управление системами. М.: Радио и связь, 1982. 392 с.
2. Kabanov D., Kabanov S. Application of algorithm of forecasting model to the optimal control of nuclear reactor // Proc. 4th MathMOD, 5—7 Febr., 2003, Vienna. Full Papers CD. Vol. 2. P. 1466—1471.
3. Справочник по теории автоматического управления / Под ред. А. А. Красовского. М.: Наука, 1987. 712 с.
4. Кабанов С. А. Управление системами на прогнозирующих моделях. СПб.: Изд-во СПбГУ, 1997. 200 с.
Дмитрий Сергеевич Кабанов
Сведения об авторе — ГНПП „Регион“, Москва; инженер; E-mail: kabanovds@mail.ru
Рекомендована кафедрой систем обработки информации и управления БГТУ „ВОЕНМЕХ“, Санкт-Петербург
Поступила в редакцию 07.12.07 г.
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 5
27
УДК 62-50
Д. С. КАБАНОВ
ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЯДЕРНЫМ РЕАКТОРОМ С УЧЕТОМ СЛУЧАЙНЫХ ВОЗМУЩЕНИЙ
Рассматривается задача оптимального управления ядерным реактором по неполным данным. Решение основано на принципе разделения с использованием фильтра Калмана и алгоритма оптимального управления по принципу максимума. Приведены результаты численного моделирования, которое позволило установить начальные значения параметров краевой задачи, обеспечивающие сходимость итерационной процедуры при воздействии случайных возмущений.
Ключевые слова: оптимальная фильтрация, управление по принципу максимума, метод Ньютона.
Решение задачи оптимального управления такой сложной системой, как ядерный реак-
тор связано с трудностями, обусловленными необходимостью решения двухточечной краевой
задачи. При решении по неполным данным терминальной задачи управления ядерным реак-
тором, модель которого описывает одиночную группу медленных нейтронов [1, 2], требуется
увеличить плотность потока нейтронов от исходного состояния до заданного конечного в
фиксированный момент времени при минимальных затратах на управление. Использование
принципа разделения и классических целевых функционалов позволяет свести алгоритм
управления к уравнениям фильтра Калмана и решению двухточечной краевой задачи. Реше-
ние этой задачи связано с итерационной процедурой, сходимость которой существенно зави-
сит от выбора начальных значений параметров краевой задачи [1, 3]. В результате примене-
ния метода Ньютона для решения этой задачи разработан алгоритм управления и рассмотре-
ны варианты задачи с фиксированным и свободным правым концом [1, 3, 4].
Рассмотрим модель ядерного реактора в виде кинетических уравнений для размножения
медленных нейтронов [1]:
x = f (x, u, t)+ξx ;
(1)
f (x, u,t) = ( f1, f2 )T ,
f1
=
(ρ
−β)n Λ
+
λc
,
f
2
=
β Λ
n
−
λc
,
где x = (n, c)T — вектор состояния системы; n — поток нейтронов; c — поток возбужденных
радиоактивных ядер; ρ — реактивность (принимается за управление); β — доля запаздываю-
щих нейтронов деления по отношению к мгновенным нейтронам деления; Λ — эффективное
время жизни нейтронов; λ — постоянная распада для возбужденных ядер; ξx =[ξxn , 0]T ,
ξxn — случайные возмущения типа белого шума с интенсивностью Bxn = σ2xn . Величины β , Λ , λ считаются постоянными, а начальные значения переменных n и с заданными.
Уравнение наблюдения имеет вид
z = Gx+ξz ,
(2)
где z = zn — вектор измерений параметров наблюдаемого процесса; G = (1 0) ; ξz = ξn — случайный процесс типа белого шума с интенсивностью Bz = Bzn = σ2zn .
Требуется увеличить поток нейтронов от исходного состояния n(t0 ) до заданного конечного n f в момент времени t f при минимальных затратах на управление.
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 5
28 Д. С. Кабанов
Задача рассматривалась в двух постановках:
1) с заданным граничным условием n(t f ) = n f при минимизации функционала Лагранжа
tf
I = 0,5 ∫ γρ2dt ; t0
2) с целевым функционалом Больца
∫I
= 0,5α
⎡⎣n(t f
)−nf
⎦⎤2
tf
+0, 5
γρ2 dt
,
t0
здесь α, γ — заданные коэффициенты.
В соответствии с принципом разделения задаче управления предшествует задача оценивания вектора состояния системы по неполным данным, которые определяются уравнением (2).
Оптимальную оценку вектора х можно вычислить с помощью фильтра Калмана [1, 3], уравнения которого для данной задачи имеют следующий вид:
n
=
ρ−β Λ
n
+
λc
+
R11σ−zn2
(
zn
−
n
);
c
=
β Λ
n
−
λc
+
R21σ−zn2
(
zn
−
n);
⎫ ⎪ ⎪⎪ ⎬ ⎪
R
=
f
x
R
+
Rf
T x
− RGT
Bz−1GR+ Bx ,
R(t0 ) =
R0
,
⎪ ⎪⎭
(3)
здесь
f
x
=
∂f ∂x
;
R0 (1,1) = 9σ2xn ;
Bx = diag(Bxn , 0); остальные элементы матрицы начальных ко-
вариаций ошибок оценивания принимались равными нулю.
Для решения второй части задачи — выбора оптимального управления по принципу
максимума — полагаем, что вектор состояния известен точно и равен вектору оценок состоя-
ния, определенному в системе (3). Чтобы вывести уравнения, составляющие алгоритм управ-
ления по принципу максимума, запишем гамильтониан задачи
H
(
x,
u,
t
)
=
pn
⎜⎝⎛
ρ−β Λ
n
+
λc
⎞⎟⎠+
pc
⎝⎛⎜
βn Λ
−
λc
⎠⎞⎟
+
0,
5γρ2
.
Уравнения для сопряженных переменных p = ( pn , pc )T имеют вид [1—3]
p n
=
−
∂H ∂n
=−
pn
ρ−β Λ
−
pc
β Λ
,
p c
=−
∂H ∂c
=
−
pn λ +
pc λ
(4)
при граничных условиях pn (t f ) = α ⎡⎣n(t f )−n f ⎦⎤ (для второго варианта постановки задачи). Управление определяется из условия ∂H = 0 как ∂ρ
ρ(t )
= −γ−1
n(t) Λ
pn
(t).
Двухточечную краевую задачу для уравнений (1), (4) при соответствующих граничных условиях решим методом Ньютона. Для этого введем вектор невязок Φ = (Φ1, Φ2 )T , Φ1 = n(t f )−n f , Φ2 = n(t f )−n f , неявным образом зависящий от параметров краевой задачи:
r = ( pn (t0 ), pc (t0 ))T , здесь n(t f ) = f1(t f ).
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 5
Оптимальное управление ядерным реактором с учетом случайных возмущений
29
Значения вектора r вычисляются по следующему рекуррентному соотношению: ri+1 = ri +∆r , ∆r = −sΦ−r 1Φ , где матрица частных производных Φr и обратная ей матрица Φr−1 задаются выражениями
Φr
=
⎡Φ1n ⎣⎢Φ2n
Φ1c Φ2c
⎤ ⎥ ⎦
;
Φr−1
=
1 ∆
⎡Φ2c ⎢⎣−Φ2n
−Φ1c Φ1n
⎤ ⎥ ⎦
,
где
Φ1n
=
∂Φ1 ∂pn
,
Φ1c
=
∂Φ1 ∂pc
,
Φ2n
=
∂Φ2 ∂pn
,
Φ2c
=
∂Φ2 ∂pc
;
∆
— определитель матрицы
Φr .
Ввиду неявной зависимости вектора Φ от вектора r матрица частных производных Φr
находится численно. Скалярный множитель s∈(0, 1] выбирается на каждой итерации исходя из
условия
Φ(ri+1) < Φ(ri ) ,
Φ(r) =
Φ12
+
Φ
2 2
.
При
достижении
требований
по
точности
решения
задачи управления Φ(ri+1) < ε ( ε >0 — заданная малая величина) итерации прекращаются.
Вначале расчет производился для детерминированного случая в целях нахождения таких значений вектора r , при которых обеспечивается устойчивая сходимость итерационной
процедуры. Задача решалась при n(t0 ) = 0, 5 кВт, с(t0 ) = 32 кВт, ρ(t0 ) = 0 , β = 0,0064, Λ =10−3 c, λ = 0,1c–1, при этом требуемые значения следующие: n f = 5 кВт, n f = 0. Для ин-
тервала оптимизации t f −t0 =1 c, шага численного интегрирования по методу Рунге — Кутты
∆t = 0,1 c, ε = 0,1 , γ =1000 получены следующие результаты при r = (−0, 004; −0, 001)T :
n(t f ) = 5, 021 кВт, n(t f ) = 0, 066 кВт/с (за 3 итерации).
Для второго варианта постановки задачи с целевым функционалом Больца при тех же
значениях вектора r и вектора невязок с компонентами Φ1 = pn (t f )−α[n(t f )−n f ],
Φ2 = n(t f )−n f приемлемые результаты были получены при α = 0, 000 006 , ε = 0, 01:
n(t f ) = 5, 056 кВт, n(t f ) = 0, 000 028 кВт/с (за 12 итераций).
Решение задачи во втором варианте оказалось менее устойчивым к выбору параметров
алгоритма, поэтому для решения задачи при воздействии возмущений ξx , ξz был выбран пер-
вый вариант постановки. Сравнение полученного решения с результатами применения алгоритма последовательной оптимизации [4] по иерархии целевых функционалов показало [2], что достижение реактором заданной конечной величины n(f) потока нейтронов осуществля-
ется посредством управления ρmax =8,86⋅103 , тогда как в работе [2] ρmax =14⋅103 . Кроме того, достигнута более высокая точность конечного значения производной n(t f ) = 0 (в работе [2]
значение n(t f ) = 0,5 кВт/с зависит от точности итерационной процедуры подстройки модели
прогнозирования). Преимущество алгоритма, рассмотренного в работе [2], заключается в малом объеме вычислений, что позволяет формировать управление в реальном времени динамики процесса.
Совместное решение задач фильтрации и управления выявило существенный недостаток рассмотренного в настоящей статье решения, обусловленный необходимостью задания параметров двухточечной краевой задачи, достаточно близких к точным значениям. Поэтому
при расчете на интервале t∈[0; 0,9] с для обеспечения сходимости итерационной процедуры
шаг численного моделирования (∆t) принимался равным 0,02 c, а в конце расчета при
t∈(0,9; 1] с составил ∆t = 0, 01 c. Вычисления производились при следующих характеристиках
случайных процессов (среднеквадратических отклонениях): σxn = 0,1 кВт/с, σzn = 0, 3 кВт.
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 5
30 Д. С. Кабанов Получены следующие результаты: n(t f ) = 5, 025 кВт, n(t f ) = 5, 01 кВт. Как видно, численное
моделирование подтвердило возможность решения задачи оптимального управления стохастической моделью ядерного реактора по неполным данным с использованием принципа разделения.
Исследования, описанные в настоящей статье, выполнены по гранту Российского фонда фундаментальных исследований, № 09-08-00829.
СПИСОК ЛИТЕРАТУРЫ
1. Сейдж Э. П., Уайт Ч. С. Оптимальное управление системами. М.: Радио и связь, 1982. 392 с.
2. Kabanov D., Kabanov S. Application of algorithm of forecasting model to the optimal control of nuclear reactor // Proc. 4th MathMOD, 5—7 Febr., 2003, Vienna. Full Papers CD. Vol. 2. P. 1466—1471.
3. Справочник по теории автоматического управления / Под ред. А. А. Красовского. М.: Наука, 1987. 712 с.
4. Кабанов С. А. Управление системами на прогнозирующих моделях. СПб.: Изд-во СПбГУ, 1997. 200 с.
Дмитрий Сергеевич Кабанов
Сведения об авторе — ГНПП „Регион“, Москва; инженер; E-mail: kabanovds@mail.ru
Рекомендована кафедрой систем обработки информации и управления БГТУ „ВОЕНМЕХ“, Санкт-Петербург
Поступила в редакцию 07.12.07 г.
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 5