For example,Бобцов

NONTRIVIAL PENDULUM SYSTEMS CONTROL UNDER CONDITIONS OF PARAMETRIC AND FUNCTIONAL UNCERTAINTIES

УПРАВЛЕНИЕ НЕТРИВИАЛЬНЫМИ МАЯТНИКОВЫМИ СИСТЕМАМИ...
3 АНАЛИЗ И СИНТЕЗ СЛОЖНЫХ СИСТЕМ
УДК 681.513.675
УПРАВЛЕНИЕ НЕТРИВИАЛЬНЫМИ МАЯТНИКОВЫМИ СИСТЕМАМИ В УСЛОВИЯХ ПАРАМЕТРИЧЕСКОЙ И ФУНКЦИОНАЛЬНОЙ НЕОПРЕДЕЛЕННОСТЕЙ
С.А. Колюбин, А.А. Пыркин
Рассматривается проблема управления движением неполноприводных маятниковых систем в условиях параметрических и функциональных неопределенностей на примере стабилизации перевернутого положения маятника с инерционным колесом на подвижном основании. Разработан адаптивный алгоритм, реализующий цель управления при априорной неизвестности параметров объекта, наличии в системе неучтенной динамики и ограничениях на величину управляющего воздействия. В отличие от известных аналогов, алгоритм поддерживает настройку регуляторов в режиме реального времени. Эффективность предлагаемого подхода проиллюстрирована экспериментальными результатами. Ключевые слова: неполноприводная маятниковая система, адаптивное управление, идентификация, мехатронный комплекс.
Введение
Интенсивное научно-техническое развитие ставит перед современной теорией автоматического управления новые более сложные задачи. В ряде случаев классические методы не удовлетворяют необходимым критериям или оказываются просто неэффективными, тогда возникает задача разработки новых подходов.
Особый интерес вызывают методы управления объектами, характеризующимися существенно нелинейной динамикой. Большое количество работ в области теории управления, представленных за последние годы на крупнейших международных конференциях, посвящено исследованию неполноприводных маятниковых систем, как наиболее доступному и наглядному средству моделирования сложных нелинейных колебаний [1–8].
В данной работе в качестве объекта управления выбран маятник с инерционным колесом (маятник Шмидта). Стабилизация такого маятника в перевернутом положении является классической задачей. Множество работ посвящено решению этой проблемы. Так в [2] предлагается использование схемы из двух регуляторов, где первый синтезируется на основе пассификации системы, а второй – на основе локальной линеаризации частичной обратной связью [3]. Альтернативный подход представлен в [4], где глобальная асимптотическая устойчивость верхнего положения маятника обеспечивается одним непрерывным законом управления по обратной связи. Надо отметить, что при таком подходе будет затруднена экспериментальная реализация регулятора, так как здесь не учитывается ограничение на величину управляющих моментов. В [5] рассматривается задача стабилизации маятника по выходу. В [6] представлена модификация подхода [5] с учетом накладываемых ограничений на величину управления. В [7] рассматривается регулятор, обеспечивающий стабилизацию перевернутого положения при максимальном начальном отклонении. В [8] делается попытка разработки регулятора для параметрически неопределенной системы, однако предлагаемый здесь подход требует проведения предварительной идентификационной процедуры.
По мнению авторов, подобная задача не решалась ранее методами адаптивного управления. Адаптивный подход имеет очевидные перспективы, особенно если требуется практическое применение алгоритмов, например, в задачах робототехники, где разработчик зачастую сталкивается с неполнотой информации об объекте и переменной средой функционирования. Таким образом, данная работа является обобщением предыдущих результатов с усилением теоретической постановки задачи, которая решена в условиях полной параметрической неопределенности объекта.
Постановка задачи. Математическая модель объекта управления
Маятник с инерционным колесом является примером неполноприводной маятниковой системы с одной неуправляемой степенью свободы. Неполноприводные механические системы – это системы, в которых число управлений меньше числа переменных состояния (обобщенных степеней свободы). Сложность управления подобными системами обусловлена их преимущественно нелинейной динамикой. Прямая линеаризация в этом случае нереализуема, соответственно применение классических методов управления затруднено.
34 Научно-технический вестник Санкт-Петербургского государственного университета
информационных технологий, механики и оптики, 2010, № 5 (69)

С.А. Колюбин, А.А. Пыркин
Рассматриваемая маятниковая система схематично изображена на рис. 1. Она представляет собой однозвенный свободно закрепленный в точке подвеса плоский маятник с установленным на нем инерционным колесом. Управление колебаниями осуществляется за счет ускоренного вращения инерционного колеса в разных направлениях.

Рис. 1. Схематичное представление маятника Шмидта на подвижном основании

Модель объекта управления без учета динамики платформы была получена с использованием ме-

тода Лагранжа и может быть описана системой дифференциальных уравнений:

  

p1t   p2t  

p2t   p2t 

p3 sin
ut ,

t





0,

(1)

где  – угол поворота маятника;  – абсолютный угол поворота инерционного колеса; p1, p2, p3 – не-

известные параметры, зависящие от физических характеристик системы; u – управление.

Целью управления является стабилизация маятника в перевернутом положении из произвольного

начального состояния в условиях параметрической и функциональной неопределенностей и при ограни-

ченном управлении. Функциональная неопределенность может здесь быть интерпретирована как нали-

чие неучтенной динамики нестационарного основания.

Здесь надо отметить, что за основу при синтезе регуляторов будет взята гибридная схема с пере-

ключением между раскачивающим и стабилизирующим алгоритмами. Такая постановка обусловлена

необходимостью соблюдения малости управляющего момента.

Идентификация неизвестных параметров

Первоначально для выполнения параметризации исходной системы (1) введем в рассмотрение

вспомогательные фильтры второго порядка

H f ( p) 

k ( p  )2

,

где

p



d dt

– оператор дифференцирова-

ния; k  0,   0 – параметры фильтра. Дополнительно введем новую функцию   sin() . Таким обра-

зом, после соответствующих преобразований можно переписать модель системы в регрессионной форме:

  

y1 y2

 

1T , T2 ,

,

(2)

где

y1   f ,

y2   f ,

1T



  

1 p1  p2

 p3 p1  p2

  

и



T 2



  

p1 p2 ( p1 

p2 )

p1

p3 

p2

  

– векторы

неизвестных

параметров; T  u f  f  – регрессор;  f  H f ( p) ,  f  H f ( p) , u f  H f ( p)u ,  f  H f ( p) – со-
ответствующие выходные сигналы фильтров. Для дальнейшего использования в экспериментах на мехатронном комплексе для идентификации
неизвестных параметров объекта был предложен рекуррентный алгоритм на основе наименьших квадратов. Этот алгоритм может использоваться в дискретных системах, т.е. менее чувствителен к периоду дискретизации чем, например, метод скоростного градиента, а реализация на цифровом оборудовании всегда сопряжена с проявлением процессов квантования сигналов по времени.
Введем следующие массивы данных:

Y1   y1(1) y1(2)  y1(N )T ,

Y2   y2 (1) y2 (2)  y2 (N)T ,

  φ(1) φ(2)  φ(N)T ,

Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики, 2010, № 5(69)

35

УПРАВЛЕНИЕ НЕТРИВИАЛЬНЫМИ МАЯТНИКОВЫМИ СИСТЕМАМИ...

где N – число последовательных измерений, y1(i) , y2 (i) , φ(i) при i  1: N – значения соответствующих

величин на   12

каждой итерации.
 ( T )1 Y1,  ( T )1  Y2 ,

Тогда

схема

идентификации

имеет

вид:

где 1, 2 – векторы оценок неизвестных параметров.

(3)

Замечание 1: Алгоритм идентификации (3) при увеличении числа итераций N обеспечивает схо-

димость оценок параметров к истинным значениям, если матрица  T не вырождена.

Реализуемый алгоритм идентификации для системы (2) описывается следующей системой уравне-

ний:



 

j

K

(t) (t)

 

  j (t 1)  K P(t 1)φ(t) /

(t

)(

y

j

(t

)



φT

(t

 )

j

(t



1)),

(1 φT (t)P(t 1)φ(t)),

P(t)  (I2  K (t)φT (t))P(t 1),

(4)

где j  1, 2 , I2  2  2 – единичная матрица. После некоторых преобразований получаем выражения для

пгдреямчеоргpое1звыч1(,iиj2)с,1(л1i1е,)н(jия1(11(21н1,)12е)иозвб(2е1о1сз) т)нн,аычpех2нпыарсао1(2мо1)те1втертосв(21т1ов) бу, юъpе3щктиае:э11((л1211е)) м,енты матриц неизвестных параметров.

(5)

Раскачивающий алгоритм

Особенностью данной работы является то, что в систему дополнительно вносится неучтенная динамика в виде нестационарности платформы, на которой закреплен маятник. Это требует некоторой модификации раскачивающего алгоритма по сравнению с известными результатами [8]. С другой стороны, это иллюстрирует преимущества адаптивного подхода.
Для синтеза раскачивающего алгоритма был использован метод скоростного градиента [9] с энергетической целевой функцией. В работе [8] показано, что для рассматриваемой маятниковой системы в целевую функцию целесообразно вводить не гамильтониан системы, а только часть энергии, характеризующую движение непосредственно звена маятника. Тогда уравнение целевой функции выглядит следующим образом:

Q(,

 )



1 2

E 2

,

(6)

где

E  E(t, ,  )  E* (t) ,

E(t, , )



1 2

(

p1



p2 ) 2



p3 (1

cos

)

– текущая частичная энергия системы,

t
E* (t)  E0 (1  1()d ) – желаемый уровень энергии, причем E0 соответствует потенциальной энергии 0
t
неподвижного маятника в верхней точке траектории, а 1()d  – некоторая настраивающаяся функция, 0
увеличивающая значение желаемой энергии системы для компенсации движения основания,   0 .

Замечание 2: Необходимо отметить, что задача раскачки маятника на нестационарном основании

имеет смысл только тогда, когда платформа обладает значительно большей инерционностью по сравне-

нию с самим маятником.

Релейный регулятор, полученный из конечной формы алгоритма скоростного градиента, опреде-

ляется выражением:

u   signu(t, , ) ,

(7)

где





0

,

(t, , )



Q t

.

Замечание 3: Выбор релейного регулятора обусловлен стремлением обеспечить сходимость оце-

нок параметров в замкнутом контуре. В этом случае управляющий сигнал, входящий в вектор регрессора

(2), представляет собой меандр, т.е. частотно богатый сигнал. Таким образом, может быть выполнено

условие неисчезающего гармонического возбуждения для алгоритма (3).

Подставляя (6) в (7), получаем выражение для реализуемого раскачивающего алгоритма:

36 Научно-технический вестник Санкт-Петербургского государственного университета
информационных технологий, механики и оптики, 2010, № 5 (69)

С.А. Колюбин, А.А. Пыркин

где

p1

u(t) , p2 ,

 p3

sign(12 ( p1  p2 )(t)2  – оценки неизвестных

p3 (1 cos (t параметров

) из

2t )) (t (4)–(5),

), 

– оценка скорости вращения маятника.

(8)

Стабилизирующий алгоритм

В малой окрестности перевернутого положения при *   приблизительно выполняется соотно-

шение sin   (  ) mod 2 Тогда мы можем получить локально линеаризованную модель исходной

системы (1) в форме вход–состояние–выход:

 x1  x2 ,

  x2 





p1

p3  p2

x1



p1

1 

p2

u,

(9)

где

x1

   

x3 ,

x2p1p3

p2 x1 , x3

 

p2  .

(

p1 p1 

u, p2 )

Для увеличения быстродействия стабилизирующего регулятора в качестве такового был выбран

пропорционально-дифференциальный регулятор:

u(t)  k1x1  k2 x2  k3 x3 .

(10)

Для расчета коэффициентов регулятора был выбран метод модального управления на основе стан-

дартных характеристических полиномов. Характеристический полином замкнутой системы имеет вид

D(s)



s3



k3 p1  k2 p2 p2 ( p1  p2 )

s2



p3  k1 ( p1  p2 )

s



k3 p3 p2 ( p1 

p2 )

,

где

s



оператор

Лапласа.

Тогда

коэффициенты

реа-

лизуемого стабилизирующего регулятора могут быть определены из следующих соотношений:

где

k1  p3 p1, p2 , p3

 –

A2w02 ( p1  p2 ), k2  w0 ( p1  p2 )( pp13 оценки неизвестных параметров

w02 из

 A1), k3 (4)–(5),

 w03 p2 (pp31  p2 ) , w0 , A1 , A2  0 – параметры

(9) стандартного по-

линома D* (s)  s3  A1w0s2  A2w02s  w03 , выбираемые определенным образом в зависимости от требуемых показателей качества переходного процесса.

Схема переключения алгоритмов

Условия коммутации раскачивающего и стабилизирующего алгоритмов обоснованы в [1]. Здесь остановимся только на кратком описании схемы организации переключения. Закон управления в гибридной системе управления может быть описан следующим образом:

u(t

)



uu21

(t), (t),

if if

    s ,     s ,

где

u1(t) – алгоритм стабилизации (9),

u2 (t)

– раскачивающий алгоритм (8),

s



 6

– угол переключе-

ния управлений, определяющий сектор работы стабилизирующего регулятора.

Результаты экспериментальной реализации

Для экспериментальной проверки эффективности полученных алгоритмов был использован мехатронный маятниковый комплекс Mechatronic Control Kit фирмы Mechatronics Systems Inc., находящийся в распоряжении кафедры систем управления и информатики СПбГУ ИТМО. Подробное описание комплекса дано в [1], внешний вид установки представлен на рис. 2.
На рис. 3 представлены результаты аппаратно-программной реализации синтезированных алгоритмов, иллюстрирующие эффективность предложенного подхода в решении поставленной задачи.

Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики, 2010, № 5(69)

37

УПРАВЛЕНИЕ НЕТРИВИАЛЬНЫМИ МАЯТНИКОВЫМИ СИСТЕМАМИ...
Рис. 2. Внешний вид экспериментальной маятниковой установки
u(t)
Рис. 3. Переходные процессы в реальной системе при
k  2,   5,   0, 015,   1, 5, A1  2, 05, A2  2, 39, w0  0, 05 Заключение
В результате была разработана адаптивная гибридная система управления, реализующая раскачку и стабилизацию положения неустойчивого равновесия маятника Шмидта в условиях параметрической неопределенности и при наличии в системе неучтенной динамики. В отличие от известных аналогов, полученные алгоритмы не требуют предварительных идентификационных процедур и обеспечивают настройку параметров регуляторов в процессе работы.
Работа поддержана Федеральной целевой программой «Научные и научно-педагогические кадры инновационной России» на 2009–2013 годы (государственный контракт № П127 от 13 апреля 2010г.).
Литература 1. Astrom K.J., Block D.J., Mark W. Spong The Reaction Wheel Pendulum. Synthesis Lectures on Controls
and Mechatronics // Morgan and Claypool Publishers. – 2007. – 105 p. 2. Spong M., Corke P. and R. Lozano. Nonlinear control of the reaction wheel pendulum // Automatica. –
2001. – V. 37. – P. 1845–1851. 3. Spong M. Partial feedback linearization of underactuated mechanical systems, in Proc. Intern. Conf. Intelli-
gent Robots and Systems, Munich, Germany. – 1994. – Р. 314–321. 4. Olfati-Saber R. Global stabilization of a flat underactuated system: the inertia wheel pendulum, in Proc.
40th Conf. Decision and Control, Orlando, USA. – 2001. – P. 3764–3765. 5. Ortega R., Spong M., Gomez-Estern F. and G. Blankenstein. Stabilization of a class of underactuated me-
chanical systems via interconnection and damping assignment // IEEE Trans. Autom. Control. – 2002. – V. 47. – P. 1218–1233.
38 Научно-технический вестник Санкт-Петербургского государственного университета
информационных технологий, механики и оптики, 2010, № 5 (69)

В.А. Толмачев, М.В. Никитина, М.Е. Сергеева

6. Santibanez V., Kelly R. and J. Sandoval. Control of the inertia wheel pendulum by bounded torques, in Proc. 44th Conf. Decision and Control and the European Control Conf., Seville, Spain. – 2005. – P. 8266– 8270.
7. Гришин А.А., Ленский А.В., Охоцимский Д.Е. и др. О синтезе управления неустойчивым объектом. Перевернутый маятник // Изв. РАН. Теория и системы управления. – 2002. – № 5. – С. 14–24.
8. Андриевский Б.Р. Стабилизация перевернутого маятника с инерционным маховиком в качестве движителя. Управление в физико-технических системах / Под ред. А.Л. Фрадкова. – СПб: Наука, 2004. – С. 52–71.
9. Мирошник И.В., Никифоров В.О., Фрадков А.Л. Нелинейное и адаптивное управление сложными динамическими системами. – СПб: Наука, 2000. – 549 с.

Колюбин Сергей Алексеевич Пыркин Антон Александрович

– Санкт-Петербургский государственный университет информационных технологий, механики и оптики, студент, ksa_tau@mail.ru
– Санкт-Петербургский государственный университет информационных технологий, механики и оптики, аспирант, a.pyrkin@gmail.com

Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики, 2010, № 5(69)

39