РОБАСТНОЕ УПРАВЛЕНИЕ РОБОТОМ-МАНИПУЛЯТОРОМ В ДИСКРЕТНОМ ВРЕМЕНИ
РОБАСТНОЕ УПРАВЛЕНИЕ РОБОТОМ-МАНИПУЛЯТОРОМ …
УДК 62-50
РОБАСТНОЕ УПРАВЛЕНИЕ РОБОТОМ-МАНИПУЛЯТОРОМ В ДИСКРЕТНОМ ВРЕМЕНИ6
С.В. Гусев
Рассматривается проблема управления движением робота-манипулятора в условиях неопределенности относительно его динамических характеристик и при наличии недоступных измерению возмущений. Предложен линейный регулятор для стабилизации программных движений робота-манипулятора, действующий в дискретном времени. Показано, что при уменьшении интервала дискретизации регулятор может обеспечить стабилизацию программного движения с любой наперед заданной точностью. Ключевые слова: робот-манипулятор, робастное управление, линейный регулятор, дискретное время.
Введение
Существует несколько подходов к решению проблемы управления движением роботаманипулятора в условиях неопределенности: адаптивное управление [1–6], робастное управление [7–9], управление с помощью скользящих режимов [10, 11], управление с помощью нейронных сетей [12, 13]. При этом большинство публикаций посвящено управлению в непрерывном времени. В то же время как измерения, так и управление в современных роботах осуществляются с помощью цифровых устройств, действующих в дискретном времени. По этой причине построение регуляторов в дискретном времени представляет очевидный практический интерес.
Существенно меньше публикаций касается управления роботом-манипулятором в дискретном времени [1, 14–17]. В этих работах строятся нелинейные регуляторы. Цель данной работы – предложить линейный робастный регулятор, действующий в дискретном времени и использующий минимум информации о динамике робота.
Постановка задачи
Динамика манипулятора описывается уравнениями Лагранжа A(q)q b(q ,q) = u w(t) ,
(1)
где q Rn – вектор обобщенных координат; q и q – его первая и вторая производные; u Rn – вектор
обобщенных моментов, развиваемых соответствующими приводами; w Rn – возмущение; симметричная матрица A(q) Rnn – матрица кинетической энергии; b(q ,q) Rn. Относительно возмущения w(t)
предполагается только, что оно ограничено: | w(t) | C .
В частности, w(t) может включать разрывные силы трения. Предположим, что матрица кинетиче-
ской энергии A(q) при всех q удовлетворяет неравенствам
I A(q) aI ,
(2)
где , a > 0 ; I – единичная матрица размера n n . Неравенства (2) понимаются как неравенства для
квадратичных форм. При построении регулятора будет использована только константа , знание вели-
чин a и C не требуется.
Предполагается, что задано программное движение p(t) Rn , которое имеет непрерывные и ог-
раниченные первую и вторую производные. Целью управления является отслеживание программного движения с заданной точностью.
Особенностью данной работы является то, что управление и измерения происходят в дискретном
времени. Пусть задано некоторое > 0, определяющее интервал дискретизации времени. Предполагает-
ся, что в дискретные моменты tk = k, k = 0,1, 2,, измеряются обобщенные координаты qk = q(tk ) и скорости q k = q (tk ) . Вычисление управления u(t), используемого на интервале [tk ,tk1) = [k, (k 1)),
также осуществляется в моменты tk . Управление имеет следующий вид:
u(t)
=
uu12kk
, ,
где где
t t
[k, k [k
/ 2,
/ 2), (k 1)).
(3)
Здесь
u1k
– управление на первой половине, а
u
2 k
– управление на второй половине интервала
[tk , tk 1 ).
6 Работа выполнена при финансовой поддержке ФЦП «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007–2013 годы» (государственный контракт № 11.519.11.4007).
38 Научно-технический вестник информационных технологий, механики и оптики,
2013, № 1 (83)
С.В. Гусев
Рассмотрим
векторы
Xk
=
q (tk q(tk
) )
,
Zk
=
p (tk p(tk
) )
,
k = 0,1, 2,,
определяющие значения реального
и программного фазового вектора системы в момент tk . Роль нового управления в системе, функциони-
рующей в дискретном времени, будет играть вектор
Uk
=
u1k
u
2 k
.
При
построении стабилизирующего
управления рассмотрим два случая: управление при отсутствии и при наличии начального рассогласова-
ния между программным и реальным движением.
Управление при отсутствии начального рассогласования
Закон управления определим соотношением Uk = G()(Xk Zk ) ,
(4)
где > 0,
G
()
=
31I 1I
Теорема 1. Пусть
< 2 .
42I
42I
– матрица размера
2n 2n.
(5)
Найдутся такие константы > 0 и K > 0, что для любого начального состояния X0 и для всех неравенства
| q(t) p(t) | K2 , | q (t) p (t) | K , | u(t) | K ,
выполнены на решениях замкнутой системы управления (1), (3), (4) при всех t 0, при условии, что ре-
альное состояние совпадает с программным в начальный момент, т.е.
X0 = Z0.
(6)
В принципе условие (6) не является ограничительным, так как всегда можно построить удовлетво-
ряющее ему программное движение. Однако обычно программное движение задано заранее, и средства
для его изменения не предусмотрены в системе управления. Исходя из этого, представляет интерес по-
строить управление, обеспечивающее стабилизацию программного движения без предположения (6).
Управление при наличии начального рассогласования
Пусть вектор r(t) Rn есть решение устойчивого линейного дифференциального уравнения
r(t) d1r(t) d0r(t) = 0
с начальными данными r(0) = q(0) p(0), r(0) = q (0) p (0) .
(7) (8)
Вектор r(t) представляет собой желаемую невязку между реальным и программным движением в
переходном процессе. В силу устойчивости уравнения (7) r(t) 0 при t .
Пусть
Yk
=
r (tk r(tk
) )
.
Из (7) следует,
что
Yk = TYk 1, k = 1, 2,,
(9)
где
T
=
exp
d1I I
d0I 0
.
Начальное
условие
(8)
принимает
вид
Y0 = X0 Z0 . Определим закон управления соотношением
(10)
Uk = G()(Xk Zk Yk ), k = 0,1, 2,,
(11)
где векторы Yk вычисляются рекуррентно в силу (9), (10) . Теорема 2. Пусть выполнено неравенство (5). Найдутся такие константы > 0 и K > 0, что
для любого начального состояния X0 и для всех неравенства | q(t) p(t) r(t) | K2 , | q (t) p (t) r(t) | K, | u(t) | K ,
выполнены на решениях замкнутой системы управления (1), (3), (9)–(11) при всех t 0. Меняя коэффициенты d0 , d1 уравнения (7), можно задавать желаемый (например, неколебатель-
ный) характер переходного процесса в замкнутой системе. В частности, за счет роста перерегулирования
Научно-технический вестник информационных технологий, механики и оптики, 2013, № 1 (83)
39
РОБАСТНОЕ УПРАВЛЕНИЕ РОБОТОМ-МАНИПУЛЯТОРОМ …
можно сделать время переходного процесса сколь угодно малым, и, наоборот, за счет увеличения времени переходного процесса можно уменьшить перерегулирование.
Заключение
Предложен регулятор для стабилизации программных движений робота-манипулятора, учитывающий специфику современных цифровых систем управления, – регулятор, действующий в дискретном времени. Регулятор является линейным, он использует дискретизованные по времени значения обобщенных координат и скоростей робота и строит кусочно-постоянное управление. Для расчета регулятора необходимо знать единственный параметр робота-манипулятора – нижнюю оценку собственных чисел матрицы кинетической энергии. Это обеспечивает робастность регулятора к изменениям параметров робота, что важно во многих практических задачах. В дальнейшем представляет интерес рассмотреть возможность построения аналогичного регулятора, использующего только измерения обобщенных координат робота.
Литература
1. Гусев С.В., Якубович В.А. Алгоритм адаптивного управления роботом-манипулятором // Автоматика и телемеханика. – 1980. – № 9. – С. 101–111.
2. Craig J., Hsu P., Sastry S. Adaptive control of mechanical manipulators // Proceedings of the IEEE International Conference on Robotics and Automation. – 1986. – V. 3. – P. 190–195.
3. Slotine J.-J.E., Li W. On the Adaptive Control of Robot Manipulators // The International Journal of Robotics Research. – 1987. – V. 6. – P. 49–59.
4. Midleton P., Goodwin G.C. Adaptive computed torque control for rigid link manipulations // System and Control Letters. – 1988. – V. 10. – P. 9–16.
5. Cheah C.C., Liu C., Slotine J.-J.E. Adaptive Tracking Control for Robots with Unknown Kinematic and Dynamic Properties // The International Journal of Robotics Research. – 2006 – V. 25. – P. 283–296.
6. Huang A.C., Chien M.C. Adaptive Control of Robot Manipulators: A Unified Regressor-Free Approach. – World Scientific. – 2010. – 262 p.
7. Gusev S.V. Linear stabilization of nonlinear system program motion // Systems and Control Letters. – 1988. – V. 11. – P. 409–412.
8. Qu Z., Dorsey J. Robust PID control for robots // International Journal of Robotics and Automation. – 1991. – V. 6. – P. 228–235.
9. Herman P., Franelak D. Robust tracking controller with constraints using generalized velocity components for manipulators // Transactions of the Institute of Measurement and Control. – 2008. – V. 30. – P. 101–113.
10. Пятницкий Е.С., Дунская Н.В. Стабилизация управляемых механических и электромеханических систем // Автоматика и телемеханика. – 1988. – № 12. – С. 40–51.
11. Garcнa-Rodrнguez R., Parra-Vega V. Cartesian sliding PID control schemes for tracking robots with uncertain Jacobian // Transactions of the Institute of Measurement and Control. – 2012. – V. 34. – P. 448– 462.
12. Barambones O., Etxebarria V. Robust neural control for robotic manipulators // Automatica. – 2002. – V. 38. – P. 235–242.
13. Jiang Z.-H., Ishita T. A Neural Network Controller for Trajectory Control of Industrial Robot Manipulators // Journal of Computers. – 2008. – V. 3. – № 8. – P. 1–8.
14. Middleton R.H. Adaptive control for robot manipulators using discrete time identification // IEEE Transactions on Automatic Control. – 1990. – V. 35. – P. 633–637.
15. Yang S.-P., Woo P.-Y., Wang R. Discrete-Time Model Reference Adaptive Controller Designs for Robotic Manipulators // Proceedings of the American Control Conference. – 1993. – P. 1145–1149.
16. Sun F.C., Sun Z.Q., Zhang R.J., Chen Y.B. Discrete-time tracking control of robotic manipulators based on dynamic inversion using dynamic neural networks // Proceedings of the IEEE International Symposium on Intelligent Control. – 2000. – P. 333–338.
17. Corradinia M.L., Fossib V., Giantomassib A., Ippolitib G., Longhib S., Orlandob G. Discrete time sliding mode control of robotic manipulators: Development and experimental validation // Control Engineering Practice. – 2012. – V. 20. – P. 816–822.
Гусев Сергей Владимирович
– Санкт-Петербургский государственный университет, кандидат физ.-мат. наук, ст. научный сотрудник, доцент, gusev@ieee.org
40 Научно-технический вестник информационных технологий, механики и оптики,
2013, № 1 (83)
УДК 62-50
РОБАСТНОЕ УПРАВЛЕНИЕ РОБОТОМ-МАНИПУЛЯТОРОМ В ДИСКРЕТНОМ ВРЕМЕНИ6
С.В. Гусев
Рассматривается проблема управления движением робота-манипулятора в условиях неопределенности относительно его динамических характеристик и при наличии недоступных измерению возмущений. Предложен линейный регулятор для стабилизации программных движений робота-манипулятора, действующий в дискретном времени. Показано, что при уменьшении интервала дискретизации регулятор может обеспечить стабилизацию программного движения с любой наперед заданной точностью. Ключевые слова: робот-манипулятор, робастное управление, линейный регулятор, дискретное время.
Введение
Существует несколько подходов к решению проблемы управления движением роботаманипулятора в условиях неопределенности: адаптивное управление [1–6], робастное управление [7–9], управление с помощью скользящих режимов [10, 11], управление с помощью нейронных сетей [12, 13]. При этом большинство публикаций посвящено управлению в непрерывном времени. В то же время как измерения, так и управление в современных роботах осуществляются с помощью цифровых устройств, действующих в дискретном времени. По этой причине построение регуляторов в дискретном времени представляет очевидный практический интерес.
Существенно меньше публикаций касается управления роботом-манипулятором в дискретном времени [1, 14–17]. В этих работах строятся нелинейные регуляторы. Цель данной работы – предложить линейный робастный регулятор, действующий в дискретном времени и использующий минимум информации о динамике робота.
Постановка задачи
Динамика манипулятора описывается уравнениями Лагранжа A(q)q b(q ,q) = u w(t) ,
(1)
где q Rn – вектор обобщенных координат; q и q – его первая и вторая производные; u Rn – вектор
обобщенных моментов, развиваемых соответствующими приводами; w Rn – возмущение; симметричная матрица A(q) Rnn – матрица кинетической энергии; b(q ,q) Rn. Относительно возмущения w(t)
предполагается только, что оно ограничено: | w(t) | C .
В частности, w(t) может включать разрывные силы трения. Предположим, что матрица кинетиче-
ской энергии A(q) при всех q удовлетворяет неравенствам
I A(q) aI ,
(2)
где , a > 0 ; I – единичная матрица размера n n . Неравенства (2) понимаются как неравенства для
квадратичных форм. При построении регулятора будет использована только константа , знание вели-
чин a и C не требуется.
Предполагается, что задано программное движение p(t) Rn , которое имеет непрерывные и ог-
раниченные первую и вторую производные. Целью управления является отслеживание программного движения с заданной точностью.
Особенностью данной работы является то, что управление и измерения происходят в дискретном
времени. Пусть задано некоторое > 0, определяющее интервал дискретизации времени. Предполагает-
ся, что в дискретные моменты tk = k, k = 0,1, 2,, измеряются обобщенные координаты qk = q(tk ) и скорости q k = q (tk ) . Вычисление управления u(t), используемого на интервале [tk ,tk1) = [k, (k 1)),
также осуществляется в моменты tk . Управление имеет следующий вид:
u(t)
=
uu12kk
, ,
где где
t t
[k, k [k
/ 2,
/ 2), (k 1)).
(3)
Здесь
u1k
– управление на первой половине, а
u
2 k
– управление на второй половине интервала
[tk , tk 1 ).
6 Работа выполнена при финансовой поддержке ФЦП «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007–2013 годы» (государственный контракт № 11.519.11.4007).
38 Научно-технический вестник информационных технологий, механики и оптики,
2013, № 1 (83)
С.В. Гусев
Рассмотрим
векторы
Xk
=
q (tk q(tk
) )
,
Zk
=
p (tk p(tk
) )
,
k = 0,1, 2,,
определяющие значения реального
и программного фазового вектора системы в момент tk . Роль нового управления в системе, функциони-
рующей в дискретном времени, будет играть вектор
Uk
=
u1k
u
2 k
.
При
построении стабилизирующего
управления рассмотрим два случая: управление при отсутствии и при наличии начального рассогласова-
ния между программным и реальным движением.
Управление при отсутствии начального рассогласования
Закон управления определим соотношением Uk = G()(Xk Zk ) ,
(4)
где > 0,
G
()
=
31I 1I
Теорема 1. Пусть
< 2 .
42I
42I
– матрица размера
2n 2n.
(5)
Найдутся такие константы > 0 и K > 0, что для любого начального состояния X0 и для всех неравенства
| q(t) p(t) | K2 , | q (t) p (t) | K , | u(t) | K ,
выполнены на решениях замкнутой системы управления (1), (3), (4) при всех t 0, при условии, что ре-
альное состояние совпадает с программным в начальный момент, т.е.
X0 = Z0.
(6)
В принципе условие (6) не является ограничительным, так как всегда можно построить удовлетво-
ряющее ему программное движение. Однако обычно программное движение задано заранее, и средства
для его изменения не предусмотрены в системе управления. Исходя из этого, представляет интерес по-
строить управление, обеспечивающее стабилизацию программного движения без предположения (6).
Управление при наличии начального рассогласования
Пусть вектор r(t) Rn есть решение устойчивого линейного дифференциального уравнения
r(t) d1r(t) d0r(t) = 0
с начальными данными r(0) = q(0) p(0), r(0) = q (0) p (0) .
(7) (8)
Вектор r(t) представляет собой желаемую невязку между реальным и программным движением в
переходном процессе. В силу устойчивости уравнения (7) r(t) 0 при t .
Пусть
Yk
=
r (tk r(tk
) )
.
Из (7) следует,
что
Yk = TYk 1, k = 1, 2,,
(9)
где
T
=
exp
d1I I
d0I 0
.
Начальное
условие
(8)
принимает
вид
Y0 = X0 Z0 . Определим закон управления соотношением
(10)
Uk = G()(Xk Zk Yk ), k = 0,1, 2,,
(11)
где векторы Yk вычисляются рекуррентно в силу (9), (10) . Теорема 2. Пусть выполнено неравенство (5). Найдутся такие константы > 0 и K > 0, что
для любого начального состояния X0 и для всех неравенства | q(t) p(t) r(t) | K2 , | q (t) p (t) r(t) | K, | u(t) | K ,
выполнены на решениях замкнутой системы управления (1), (3), (9)–(11) при всех t 0. Меняя коэффициенты d0 , d1 уравнения (7), можно задавать желаемый (например, неколебатель-
ный) характер переходного процесса в замкнутой системе. В частности, за счет роста перерегулирования
Научно-технический вестник информационных технологий, механики и оптики, 2013, № 1 (83)
39
РОБАСТНОЕ УПРАВЛЕНИЕ РОБОТОМ-МАНИПУЛЯТОРОМ …
можно сделать время переходного процесса сколь угодно малым, и, наоборот, за счет увеличения времени переходного процесса можно уменьшить перерегулирование.
Заключение
Предложен регулятор для стабилизации программных движений робота-манипулятора, учитывающий специфику современных цифровых систем управления, – регулятор, действующий в дискретном времени. Регулятор является линейным, он использует дискретизованные по времени значения обобщенных координат и скоростей робота и строит кусочно-постоянное управление. Для расчета регулятора необходимо знать единственный параметр робота-манипулятора – нижнюю оценку собственных чисел матрицы кинетической энергии. Это обеспечивает робастность регулятора к изменениям параметров робота, что важно во многих практических задачах. В дальнейшем представляет интерес рассмотреть возможность построения аналогичного регулятора, использующего только измерения обобщенных координат робота.
Литература
1. Гусев С.В., Якубович В.А. Алгоритм адаптивного управления роботом-манипулятором // Автоматика и телемеханика. – 1980. – № 9. – С. 101–111.
2. Craig J., Hsu P., Sastry S. Adaptive control of mechanical manipulators // Proceedings of the IEEE International Conference on Robotics and Automation. – 1986. – V. 3. – P. 190–195.
3. Slotine J.-J.E., Li W. On the Adaptive Control of Robot Manipulators // The International Journal of Robotics Research. – 1987. – V. 6. – P. 49–59.
4. Midleton P., Goodwin G.C. Adaptive computed torque control for rigid link manipulations // System and Control Letters. – 1988. – V. 10. – P. 9–16.
5. Cheah C.C., Liu C., Slotine J.-J.E. Adaptive Tracking Control for Robots with Unknown Kinematic and Dynamic Properties // The International Journal of Robotics Research. – 2006 – V. 25. – P. 283–296.
6. Huang A.C., Chien M.C. Adaptive Control of Robot Manipulators: A Unified Regressor-Free Approach. – World Scientific. – 2010. – 262 p.
7. Gusev S.V. Linear stabilization of nonlinear system program motion // Systems and Control Letters. – 1988. – V. 11. – P. 409–412.
8. Qu Z., Dorsey J. Robust PID control for robots // International Journal of Robotics and Automation. – 1991. – V. 6. – P. 228–235.
9. Herman P., Franelak D. Robust tracking controller with constraints using generalized velocity components for manipulators // Transactions of the Institute of Measurement and Control. – 2008. – V. 30. – P. 101–113.
10. Пятницкий Е.С., Дунская Н.В. Стабилизация управляемых механических и электромеханических систем // Автоматика и телемеханика. – 1988. – № 12. – С. 40–51.
11. Garcнa-Rodrнguez R., Parra-Vega V. Cartesian sliding PID control schemes for tracking robots with uncertain Jacobian // Transactions of the Institute of Measurement and Control. – 2012. – V. 34. – P. 448– 462.
12. Barambones O., Etxebarria V. Robust neural control for robotic manipulators // Automatica. – 2002. – V. 38. – P. 235–242.
13. Jiang Z.-H., Ishita T. A Neural Network Controller for Trajectory Control of Industrial Robot Manipulators // Journal of Computers. – 2008. – V. 3. – № 8. – P. 1–8.
14. Middleton R.H. Adaptive control for robot manipulators using discrete time identification // IEEE Transactions on Automatic Control. – 1990. – V. 35. – P. 633–637.
15. Yang S.-P., Woo P.-Y., Wang R. Discrete-Time Model Reference Adaptive Controller Designs for Robotic Manipulators // Proceedings of the American Control Conference. – 1993. – P. 1145–1149.
16. Sun F.C., Sun Z.Q., Zhang R.J., Chen Y.B. Discrete-time tracking control of robotic manipulators based on dynamic inversion using dynamic neural networks // Proceedings of the IEEE International Symposium on Intelligent Control. – 2000. – P. 333–338.
17. Corradinia M.L., Fossib V., Giantomassib A., Ippolitib G., Longhib S., Orlandob G. Discrete time sliding mode control of robotic manipulators: Development and experimental validation // Control Engineering Practice. – 2012. – V. 20. – P. 816–822.
Гусев Сергей Владимирович
– Санкт-Петербургский государственный университет, кандидат физ.-мат. наук, ст. научный сотрудник, доцент, gusev@ieee.org
40 Научно-технический вестник информационных технологий, механики и оптики,
2013, № 1 (83)