Например, Бобцов

ТЕХНОЛОГИЯ LEGO MINDSTORMS NXT В ОБУЧЕНИИ СТУДЕНТОВ ОСНОВАМ АДАПТИВНОГО УПРАВЛЕНИЯ

А.А. Бобцов и др.

9 НОВЫЕ ТЕХНОЛОГИИ В ОБРАЗОВАНИИ

УДК 681.51.015
ТЕХНОЛОГИЯ LEGO MINDSTORMS NXT В ОБУЧЕНИИ СТУДЕНТОВ ОСНОВАМ АДАПТИВНОГО УПРАВЛЕНИЯ
А.А. Бобцов, Ю.А. Капитанюк, А.А. Капитонов, С.А. Колюбин, А.А. Пыркин, С.А. Чепинский, С.В. Шаветов
Описаны лабораторные работы (ЛР) с использованием установок, основанных на технологии Lego Mindstorms NXT и состоящих из ряда электромеханических систем. Установки используются для научных и образовательных целей, позволяя исследовать и сравнивать различные алгоритмы идентификации и адаптивного управления. Представлены результаты апробации теоретических алгоритмов адаптивного управления для различных мобильных роботов, собранных из конструктора Lego Mindstorms NXT (гусеничных, колесных и шагающих), и мехатронной маятниковой установки с инерционным маховиком на подвижном основании. Ключевые слова: LEGO Mindstorms NXT, адаптивное управление, мобильные роботы, мехатронный комплекс, обучение студентов.
Введение
Скажи мне, и я забуду; Покажи мне, и я, может быть, запомню;
Вовлеки меня, и я пойму. Конфуций (450 г. до н.э.)
В современной России, как и в мире в целом, падает интерес школьников и студентов к изучению точных наук, среди которых важнейшими являются математика, физика, информатика и т.п. Приходится признать тот факт, что средний уровень подготовки по математике и физике значительно упал. Можно бесконечно рассуждать о причинах, но, представляется, надо искать выходы из данной ситуации и поднимать статус точных наук у школьников и студентов. Именно привлечение или вовлечение в образовательный процесс является тем инструментом, который позволит вернуть былую славу и популярность математике, физике и информатике. Сегодня информатика пользуется популярностью, но лишь как придаток к модному словосочетанию «информационные технологии». Информационные технологии стали крайне популярными среди молодежи в мире, в том числе и в России – возможно, из-за молодости информационных технологий как направления в науке, возможно, из-за той свободы во времени, которую получает специалист, не привязанный ни к расписанию работы офиса, ни к рабочему месту. Конечно, это и большой уровень заработной платы, и, что немаловажно, романтика. Молодые люди видят с экрана кино и телевизора, как нищий программист-отшельник спасает мир одним нажатием кнопки. Однако мало кто даже из программистов среднего уровня понимает, что во главу угла положена именно математика. За математикой следует теория автоматического управления, где возникают те же проблемы, хотя, на взгляд авторов, теория управления сочетает в себе и математику, и физику, и информатику, электротехнику и электронику. Часто молодые люди только в аспирантуре начинают понимать, что точные науки им крайне необходимы.
Такие же выводы можно сделать и при подготовке инженеров, специализирующихся в области разработки систем управления. Они полагают, что математика и физика им не нужны, так как они без труда запрограммируют микроконтроллер, который будет решать сверхзадачи. «Зачем нам знать дифференциальные уравнения и теорию устойчивости Ляпунова?» – говорят они и сильно разочаровываются впоследствии, когда понимают, что студенческое время упущено, а теоретические знания необходимы. Читатель разумно спросит авторов: «Почему вы все время рассуждаете о математике и теории управления, хотя статья носит другое название?». Дело в том, что в теории управления самым романтичным разделом является теория адаптивных систем. На взгляд авторов, крайне романтично компенсировать все неопределенности объекта и достигать желаемой цели управления. Показывать студенту обычные следящие системы, построенные на базе двигателя постоянного тока, может быть кому-то интересно. Но вот она, романтика: студент программирует контроллер Lego NXT, и его робот совершает маленькие чудеса, объезжая неизвестные препятствия.
Вовлечение в обучение и романтика обучения лежат в основе предлагаемой образовательной технологии. Теория адаптивных систем как раздел теории автоматического управления позволит сделать науку об управлении более привлекательной среди молодежи. В данной работе на примере проведения конкретных ЛР освещается опыт авторов, полученный при обучении магистрантов кафедры систем управления и информатики СПбГУ ИТМО по дисциплине «Основы адаптивного управления».

Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики, 2011, № 1 (71)

103

ТЕХНОЛОГИЯ LEGO MINDSTORMS NXT В ОБУЧЕНИИ СТУДЕНТОВ ...

Лабораторная работа № 1 «Стабилизация перевернутого маятника»

Теоретические положения, используемые в данной ЛР, изложены в ставших уже классическими ра-

ботах [17]. Установка, на которой выполняется ЛР, построена на базе технологий Lego NXT. В качестве

алгоритмов адаптивного управления используются подходы, опубликованные в [13, 824]. Теория адап-

тивных систем развивалась на базе двух подходов – прямого адаптивного управления и метода, предусмат-

ривающего предварительную идентификацию неизвестных параметров объекта [1, 47]. В данной ЛР на

базе идентификационного подхода исследуется система адаптивного управления маятником с инерцион-

ным маховиком. Рассматривается однозвенный маятник, пассивно закрепленный на оси вращения, с распо-

ложенным на его конце, удаленном от оси вращения, инерционным маховиком. На рис. 1, а, представлено

схематическое изображение маятника с инерционным маховиком на подвижном основании. Конструкция

механической части маятниковой системы должна быть максимально простой для быстрой сборки, а также

достаточно прочной, чтобы выдерживать механические колебания и вибрацию при проведении экспери-

ментов. Для создания подвижного основания (тележки) используется конструктор LEGO. Управление дви-

жением маятника осуществляется за счет изменения направления и скорости вращения инерционного ма-

ховика. В свою очередь, управление вращением инерционного маховика осуществляется посредством ре-

гулирования напряжения в цепи питания якоря электродвигателя постоянного тока, смонтированного со-

вместно с маховиком на конце маятника.

Математическая модель [1, 1215, 17, 18, 22, 23] установки в пространстве состояний может быть описана следующей системой дифференциальных уравнений:

  a sin  r  bru ,



bpu

,

(1)

где  – угол крена маятника относительно вертикали, r – угол поворота инерционного маховика отно-

сительно вертикали, a , bp , br – неизвестные комплексные параметры маятниковой системы. Ставится

задача стабилизации маятника в верхнем положении равновесия (рис. 1, б) из произвольного начального

состояния. Решение поставленной задачи разбивается на два этапа – раскачка маятника и его стабилиза-

ция в перевернутом положении. В качестве закона управления был выбран алгоритм, опубликованный в

[1215, 22, 23]. Для раскачки маятника и приведения его в заданный сектор используется метод скорост-

ного градиента [3], позволяющий системе накопить энергию, соответствующую потенциальной энергии

перевернутого маятника. Благодаря такому подходу маятник входит в заданную область с минимальной

скоростью. Второй алгоритм, основанный на методе модального управления, обеспечивает стабилиза-

цию маятника в перевернутом положении. Такая гибридная система управления была предложена в [1].

Однако этот подход предполагает точное знание всех массогабаритных параметров системы для форми-

рования закона управления.

Основными отличиями рассматриваемого в ЛР подхода является параметрическая неопределен-

ность и подвижное основание, собранное из конструктора LEGO [12, 13, 15, 23]. Изучаемый метод вклю-

чает в себя адаптивный идентификационный контур, в котором в режиме онлайн происходит оценивание

параметров a , bp , br модели (1). Оценки, полученные на основе метода наименьших квадратов, под-

ставляются в алгоритмы раскачки и стабилизации. Результат превосходит все ожидания. Маятник еще

быстрее раскачивается и удерживается в перевернутом неустойчивом положении, в то время как оценки

трех параметров стремятся к некоторым постоянным значениям.

а бв
Рис. 1. Маятник с инерционным маховиком на подвижном основании: структурная схема маятника (а); маятник в верхнем неустойчивом положении равновесия (б); маятник на подвижном основании (в)
Данная конструкция оказалась интересной для решения принципиально другой задачи – компенсации внешнего возмущения [1618, 21, 24]. Ко всей конструкции, свободно перемещаемой в горизонтальной плоскости, прикладывается возмущающее воздействие, создаваемое рукой и имитирующее нерегулярную качку (рис. 1, в). Рассматривается задача стабилизации нижнего положения равновесия ма-

104

Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики, 2011, № 1 (71)

А.А. Бобцов и др.

ятника, возмущенного внешним воздействием, при условии запаздывания в канале управления [17, 18]. Для исследования работы алгоритмов в условиях запаздывания программно создается буфер в оперативной памяти контроллера мехатронного комплекса, через который пропускается функция управления: сигнал управления подается на вход буфера, а выходной сигнал буфера поступает на объект управления. Величина имитируемого запаздывания определяется размером буфера. Закон управления основан на методе адаптивной идентификации частоты гармонического сигнала [8, 16, 21, 24]. В данной ЛР запрограммирован алгоритм идентификации частоты возмущающего воздействия, обладающий робастными свойствами по отношению к нерегулярным составляющим возмущения. Алгоритм компенсации возмущения формирует сигнал управления, подаваемый на двигатель, с тем, чтобы парировать возмущения и удерживать маятник в вертикальном устойчивом положении без колебаний.

Лабораторная работа № 2 «Движение вдоль неизвестной траектории»

В качестве объекта управления рассматривается мобильный робот с гусеничным приводом, собранный из конструктора Lego NXT. Сначала решается более простая задача – слежение за подвижным объектом или целью. Объектом слежения может быть любой предмет, например, книга (рис. 2). На макете установлен ультразвуковой датчик, измеряющий дистанцию до книги. Алгоритм управления сравни-
вает текущее расстояние с заданным и на основе ошибки слежения e(t) формирует сигнал управления на

сервоприводы. Закон управления имеет вид

u1  u(t) , u2  u(t) ,

(2)

где u1 и u2 – сигналы управления, подаваемые непосредственно на сервоприводы. Для расчета сигнала

управления u(t) был использован метод «последовательный компенсатор» [2, 911, 19, 20]:

u(t)  k( p)1(t) ,

(3)

...12

 

2 , 3 ,

 1  (k11  k22  ...  k11  k1e),

(4)

где число k  0 ; ( p) – гурвицев полином степени  1, где  – относительная степень выбираемой

модели движения робота; число   k ; коэффициенты ki рассчитываются из требований асимптотической устойчивости системы (4) при нулевом входе. Настройка параметров k и  осуществлялась за счет увеличения их значений до тех пор, пока не выполнялось условие [11]

e(t)  0 для t  t1 ,

(5)

где положительное число 0 задается разработчиком системы управления.

Рис. 2. Удержание заданной дистанции

Для настройки параметра k использовался алгоритм

t
k(t)  ()d ,
t0





0

k

2

,

(t

)



 0

0

при при

e(t)  0 e(t)  0 ,

(6)

где числа 0  0 и 0  0 . Далее рассматривалась задача адаптивного управления движением мобиль-

ного робота вдоль неизвестной траектории (рис. 3, а, б). На базе конструктора Lego NXT собрана мо-

бильная установка с гусеничным приводом, на которой установлен ультразвуковой датчик расстояния,

измеряющий дистанцию до стены, вдоль которой происходит движение. Кривизна стены заранее не оп-

ределена. Робот, двигаясь в направлении стены, определяет расстояние до нее, сравнивает это значение с

Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики, 2011, № 1 (71)

105

ТЕХНОЛОГИЯ LEGO MINDSTORMS NXT В ОБУЧЕНИИ СТУДЕНТОВ ...

заданным и на основе траекторной ошибки формирует сигналы управления на приводы. Закон управле-

ния имеет вид

u1  u (t)  u(t) , u2  u (t)  u(t) ,

(7)

где u1 и u2 – сигналы управления, подаваемые непосредственно на сервоприводы, функция u выбирается пропорционально скорости, с которой макет будет двигаться на прямом участке траектории, функ-

ция u вносит рассогласование между приводами, что обусловливает поворот робота влево или вправо.

Для расчета сигнала управления u(t) использовался алгоритм (3)(6).

аб

в

Рис. 3. Движение мобильного робота вдоль неизвестной траектории: схема движения (а); практическая реализация (б); схема объезда препятствия и возврата на заданную траекторию (в)

Усложняя задачу управления роботом, поставим на пути его движения внешнее препятствие (рис. 3, в). Робот двигается по заданной траектории и видит на своем пути препятствие. Подъехав к нему на некоторое расстояние, робот начинает объезжать препятствие, удерживая заданную дистанцию от него. По мере приближения к основной траектории робот начинает выруливать на нее, оставляя позади
препятствие. При движении по заданной траектории может быть использован алгоритм (3)(7) при усло-
вии, что доступна измерению траекторная ошибка e(t) . Этот же подход используется для построения

алгоритма объезда препятствия на заданном расстоянии.

Лабораторная работа № 3 «Адаптивное управление двух- и одноколесными балансирующими роботами»

В ЛР предполагается, что робот имеет только два колеса (рис. 4, а, б). В первую очередь необхо-

димо решить задачу стабилизации робота в вертикальном положении. Решение этой задачи аналогично

стабилизации перевернутого маятника, рассмотренного в ЛР № (рис. 1, б). Далее решается задача слеже-

ния (рис. 2), но уже на базе двухколесного балансирующего робота. Закон управления имеет комбиниро-

ванную структуру:

u1  us (t)  u(t) , u2  us (t)  u(t) ,

(8)

где алгоритм us рассчитывается из соображений стабилизации установки, функция u(t) выбирается в

виде (3)(6), как и в ЛР № 2 для гусеничного устойчивого робота. На рис. 4, а, представлен результат

использования комбинированного управления. Робот удерживает вертикальное положение равновесия и

заданную дистанцию до объекта слежения, равную 40 см. На рис. 4, б, показан более сложный экспери-

мент: поверхность, на которой балансирует робот, наклонена, причем угол наклона плавно изменяется, а

робот сохраняет вертикальное положение и заданное расстояние до препятствия.

а бв
Рис. 4. Двухколесный и одноколесный мобильные роботы: двухколесный робот удерживает заданную дистанцию (а); двухколесный робот удерживает заданную дистанцию на наклонной поверхности (б); макет одноколесного робота (в)

106

Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики, 2011, № 1 (71)

А.А. Бобцов и др.
Интересной и весьма сложной задачей является удержание равновесия для одноколесного робота (рис. 4, в). Наряду с задачами слежения и управления вдоль неизвестной траектории, в этой части ЛР необходимо решить задачу стабилизации вертикального положения.
Лабораторная работа № 4 «Адаптивное управление двуногим шагающим роботом»
Здесь исследуются методы адаптивного управления для двуногого шагающего робота (рис. 5). На рис. 5, а, представлен эксперимент по управлению шагающим роботом при решении задачи слежения за целью на заданном расстоянии. Данная задача, в отличие от предыдущих, усложнена нетривиальностью конструкции робота. Необходимо заставить робот ходить вперед и назад. Далее, как и в ЛР № 2 и № 3, решаются задачи управления движением робота относительно неизвестных траекторий.

аб
Рис. 5. Двуногие шагающие роботы: удержание заданной дистанции шагающим роботом (а); роботизированные ноги с тремя степенями свободы (б)
На рис. 5, б, показан эскизный образец двуногого шагающего робота, ноги которого имеют три управляемые степени свободы по аналогии с обычной ногой, у которой есть коленный и голеностопный суставы. Модель может запоминать движения, которые ей показывают на стадии «обучения», а затем воспроизводить их. В рамках ЛР студенту предложено исследовать адаптивные алгоритмы, обеспечивающие устойчивую прямолинейную походку по горизонтальной и наклонной поверхностям, а также задачи слежения за объектом, ходьба вдоль неизвестной траектории и ходьба с обходом препятствий на заданном расстоянии.
Заключение
Пределы наук походят на горизонт: чем ближе подходят к ним, тем более они отодвигаются. Пьер Буаст
В работе показаны способы вовлечения студентов в процесс изучения точных наук. Отклики студентов, их заинтересованность и идеи ставят перед авторами новые задачи, стимулируя развитие теории адаптивного управления. Уже на этапе обучения студенты начинают чувствовать себя полноправными сотрудниками кафедры, а преподаватели  наставниками, которые ищут возможности для реализации их замыслов, направляют их идеи в нужное русло.
Работа поддержана Российским фондом фундаментальных исследований (грант № 09-08-00139-а), Федеральной целевой программой «Научные и научно-педагогические кадры инновационной России» на 2009–2013 годы (государственные контракты № П498 от 8 августа 2010г. и № П127 от 13 апреля 2010г.) и грантом Президента России для молодых ученых – кандидатов наук (грант № МК-3486.2009.8).
Литература
1. Astrom K.J., Block D.J., Spong M.W. The Reaction Wheel Pendulum.  2001. 2. Bobtsov A.А. A note to output feedback adaptive control for uncertain system with static nonlinearity //
Automatica. – 2005. – № 12. – Р. 1277–1280. 3. Fradkov A.L., Miroshnik I.V. and V.O. Nikiforov. Nonlinear and adaptive control of complex systems.
Kluwer Academic Publisers. Dordrecht. – 1999. – 528 р. 4. Krstic M., Kanellakopoulos L. and P.V. Kokotovich. Nonlinear and adaptive control design. Wiley.  New
York, 1995. 5. Monopoli R.V. Model reference adaptive control with an augmented signal // IEEE Trans. on Automatic
Control.  1974.  V. 19.  № 5. 6. Narendra K.S. and L.S. Valavani. Stable adaptive controller design – direct control // IEEE Trans. on Auto-
matic Control.  1978.  V. 23.  № 4.

Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики, 2011, № 1 (71)

107

ТЕХНОЛОГИЯ LEGO MINDSTORMS NXT В ОБУЧЕНИИ СТУДЕНТОВ ...

7. Nikiforov V.O. Robust high-order tuner of simplified structure // Automatica.  1999.  V. 35.  № 8. 8. Aranovskiy S., Bobtsov A., Kremlev A., Nikolaev N., Slita O. Identification of frequency of biased har-
monic signal // European Journal of Control.  2010.  № 2.  P. 129–139. 9. Bobtsov A.A. Discussion on: «Positive Real Control for Uncertain Singular Time-delay Systems via Output
Feedback Controllers» // European Journal of Control. – 2004. – № 4. – P. 305–306. 10. Bobtsov A., Pyrkin A. A new approach to MRAC problem with disturbance rejection // 9th IFAC Workshop
ALCOSP.  Saint-Petersburg, Russia. 2007. 11. Bobtsov A., Pyrkin A. Experimental research of consecutive compensator approach on basis of mechatronic
systems // 6th EUROMECH Conference ENOC.  Saint-Petersburg, Russia, 2008. 12. Bobtsov A., Kolyubin S., Pyrkin A. Adaptive stabilization of reaction wheel pendulum on moving LEGO plat-
form // 3rd IEEE Multi-conference on Systems and Control (MSC 2009).  Saint Petersburg, Russia, 2009. 13. Bobtsov A., Kolyubin S., Pyrkin A. Stabilization of Reaction Wheel Pendulum on Movable Support with
On-line Identification of Unknown Parameters // 4th International Conference «Physics and Control» (Physcon 2009). Catania, Italy, 2009. 14. Kolyubin S., Pyrkin A. Adaptive control of a reaction wheel pendulum // 12th International Student Olym-
piad on Automatic Control BOAC.  Saint-Petersburg, Russia, 2008. 15. Kolyubin S., Pyrkin A. Development Prospects of Adaptive Stabilization of a Reaction Wheel Pendulum //
13th International Student Olympiad on Automatic Control.  Saint-Petersburg, Russia, 2010. 16. Pyrkin A., Smyshlyaev A., Bekiaris-Liberis N., Krstic M. Rejection of Sinusoidal Disturbance of Unknown
Frequency for Linear System with Input Delay // American Control Conference, Baltimore, 2010. 17. Pyrkin A., Bobtsov A., Kremlev A. Rejection of Unknown Biased Harmonic Disturbance for Nonlinear Sys-
tem with Input Delay // Time Delay System Conference, Prague, Czech Republic, 2010. 18. Pyrkin A., Bobtsov A., Chepinskiy S, Kapitanyuk Y. Compensation of Unknown Multiharmonic Distur-
bance for Nonlinear Plant with Delay in Control // 8th IFAC Symposium on Nonlinear Control Systems, Bologna, Italy, 2010. 19. Бобцов А.А., Николаев Н.А. Последовательный компенсатор в задаче управления однозвенным роботомманипулятором с гибкими связями // Мехатроника, автоматизация, управление.– 2006. – № 8. – С. 2–7. 20. Бобцов А.А., Николаев Н.А. Управление по выходу линейными системами с неучтенной паразитной
динамикой // Автоматика и телемеханика.  2009.  № 6.  С. 115–122. 21. Бобцов А.А., Колюбин С.А., Пыркин А.А. Компенсация неизвестного мультигармонического воз-
мущения для нелинейного объекта с запаздыванием по управлению // Автоматика и телемеханика. 
2010.  № 11.  С. 136148. 22. Колюбин С.А., Пыркин А.А. Адаптивное управление маятником с реакционным маховиком // Меха-
троника, автоматизация, управление.  2010.  № 5.  С. 28–32. 23. Колюбин С.А., Пыркин А.А. Управление нетривиальными маятниковыми системами в условиях па-
раметрической и функциональной неопределенностей // Научно-технический вестник СПбГУ
ИТМО.  2010.  № 69.  С. 3439. 24. Пыркин А.А. Адаптивный алгоритм компенсации параметрически неопределенного смещенного
гармонического возмущения для линейного объекта с запаздыванием в канале управления // Автома-
тика и телемеханика.  2010.  № 8.  С. 6278.
25. Mechatronic Systems, Mechatronic Control Kit. Model M-1. User’s Manual.  2001.

Бобцов Алексей Алексеевич

– Санкт-Петербургский государственный университет информационных

технологий, механики и оптики, доктор технических наук, профессор,

зав. кафедрой, bobtsov@mail.ifmo.ru

Капитанюк Юрий Андреевич

– Санкт-Петербургский государственный университет информационных

технологий, механики и оптики, студент, yura.kapitanyuk@gmail.com

Капитонов Александр Александ- – Санкт-Петербургский государственный университет информационных

рович

технологий, механики и оптики, студент, kap2fox@gmail.ru

Колюбин Сергей Алексеевич

– Санкт-Петербургский государственный университет информационных

технологий, механики и оптики, аспирант, s.kolyubin@gmail.com

Пыркин Антон Александрович

– Санкт-Петербургский государственный университет информационных

технологий, механики и оптики, кандидат технических наук, ассистент,

a.pyrkin@gmail.com

Чепинский Сергей Алексеевич

– Санкт-Петербургский государственный университет информационных

технологий, механики и оптики, кандидат технических наук, доцент,

Chepinsky_S@hotmail.com

Шаветов Сергей Васильевич

– Санкт-Петербургский государственный университет информационных

технологий, механики и оптики, студент, r41f.814ck.h4wk@gmail.com

108

Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики, 2011, № 1 (71)