Например, Бобцов

СРЕДА ИМИТАЦИОННОГО МОДЕЛИРОВАНИЯ АГЕНТНЫХ СИСТЕМ РЕАЛЬНОГО ВРЕМЕНИ

М.Г. Пантелеев, Н.В. Кохтенко, С.В. Лебедев
4 КОМПЬЮТЕРНЫЕ СИСТЕМЫ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
УДК 004.94:519.876.5
СРЕДА ИМИТАЦИОННОГО МОДЕЛИРОВАНИЯ АГЕНТНЫХ СИСТЕМ РЕАЛЬНОГО ВРЕМЕНИ
М.Г. Пантелеев, Н.В. Кохтенко, С.В. Лебедев
Рассмотрена проблема создания среды имитационного моделирования многоагентных систем для экспериментального исследования и отработки различных моделей поведения интеллектуальных агентов реального времени в условиях командного противодействия. Сформулированы требования, предъявляемые к такой среде. Предложена архитектура среды, показаны особенности ее функционирования. Ключевые слова: интеллектуальные агенты, многоагентные системы, среда имитационного моделирования, реальное время.
Введение
Концепция интеллектуальных агентов (ИА), реализующих автономное целенаправленное поведение в открытой, динамической, частично наблюдаемой среде, в настоящее время используется как при создании систем, функционирующих в физических мирах (автономные роботы, беспилотные летательные аппараты и др.), так и в виртуальных средах (программные агенты управления знаниями в Интернет и корпоративных сетях) [1, 2]. В связи с расширением практических приложений ИА и основанных на них многоагентных систем (МАС) особую актуальность приобретает создание технологических средств (инструментов и платформ), поддерживающих их разработку и исследование поведения [3]. Натурное исследование моделей автономного и группового поведения агентных систем в различных ситуациях, как правило, экономически нецелесообразно, поэтому актуальным является создание сред имитационного моделирования таких систем [4]. Существующие в настоящее время среды имитационного моделирования агентных систем, как показал анализ, обладают рядом недостатков, в частности: имеют высокую стоимость (например, VR-Forces), не поддерживают возможность моделирования ИА реального времени со сложной делиберативной архитектурой (например, AnyLogic), ориентированы на узкий класс агентных приложений и не имеют развитой поддержки проектирования агентов (например, Robosoccer).
Таким образом, важнейшей проблемой, сдерживающей широкое практическое внедрение агентных систем, является отсутствие платформы, позволяющей исследовать поведение ИА и МАС различной архитектуры средствами имитационного моделирования. Целью настоящей работы является создание программной среды имитационного моделирования (СИМ) агентных систем, функционирующих в открытых динамических мирах, с учетом требований реального времени.
Требования к СИМ
Общими требованиями к СИМ МАС являются:  универсальность – поддержка моделирования различных типов ИА в части как физической подсисте-
мы агента (ФПА), так и архитектуры интеллектуальной подсистемы агента (ИПА);  открытость – возможность добавления новых компонентов, используемых при построении имитаци-
онных моделей ИА (например, новых типов сенсоров), включая его интеллектуальную подсистему;  масштабируемость – возможность наращивания числа моделируемых объектов (в том числе ИА) без
снижения общей производительности системы. Важнейшим требованием к СИМ МАС является обеспечение возможности моделирования агент-
ных систем в реальном масштабе времени, когда длительность такта моделирования соответствует динамике процессов в моделируемой физической среде. При этом ИА, функционирующие в открытых динамических мирах, необходимо строить и моделировать как системы ограниченной рациональности. Такие системы, в общем случае, не могут за отведенное время оптимально решать стоящие перед ними задачи, а должны рационально использовать имеющееся в конкретной ситуации время обдумывания решения. В высокодинамичных средах решения должны приниматься агентом в темпе обновления данных о состоянии среды. Вследствие этого ИПА должна выдавать команды управления физической подсистеме агента, а СИМ МАС – обеспечивать обработку этих команд (т.е. пересчет физического состояния всех моделируемых агентов) в пределах такта моделирования.
Другое важное требование к создаваемой СИМ МАС – возможность мониторинга ментальной деятельности агента, т.е. фиксации в каждом такте моделирования промежуточных результатов процесса обдумывания решений агентом на каждом значимом для используемой архитектуры и модели шаге принятия решений. Эта информация должна сохраняться для последующего воспроизведения и анализа сеанса моделирования вне режима реального времени. Данное требование обусловлено необходимостью

Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики, 2012, № 1 (77)

53

СРЕДА ИМИТАЦИОННОГО МОДЕЛИРОВАНИЯ АГЕНТНЫХ СИСТЕМ …
сравнительного исследования эффективности различных архитектур ИПА как систем ограниченной рациональности.
Еще одним требованием к СИМ МАС является возможность моделирования различных стратегий координации действий в группах агентов. В настоящее время в теории МАС разработано множество подходов и моделей координации поведения агентов, ориентированных на различные классы агентных систем и решаемые ими задачи. Выбор конкретных стратегий и моделей координации выполняется разработчиком моделируемой МАС, а СИМ не должна накладывать в этой части никаких ограничений. Задачей среды является предоставление системных механизмов, позволяющих моделировать различные стратегии координации как при наличии непосредственной коммуникации между агентами, так и без нее. В первом случае СИМ МАС должна поддерживать моделирование каналов связи между агентами с учетом их ограниченной пропускной способности и дальности действия, наличия шумов и ненадежной доставки сообщений. Координация в условиях отсутствия непосредственной коммуникации предполагает наблюдение за поведением других агентов посредством собственных сенсоров и (или) получение информации о других агентах от единого центра управления (выделенного агента-координатора).
Архитектура и особенности реализации СИМ МАС
На рис. 1 представлена архитектура СИМ МАС, удовлетворяющая сформулированным выше требованиям, в составе которой выделены среда разработки и среда исполнения.
Среда разработки позволяет создавать новых агентов, задавать начальные условия сценариев моделирования и конфигурировать среду исполнения. При создании ФПА используются библиотеки классов, реализующих различные модели динамики физического носителя агента (например, управляемого полета беспилотного летательного аппарата).
Разрабатываемая СИМ МАС ориентирована, в первую очередь, на исследование агентов с делиберативной архитектурой ИПА [1, 2]. В общем случае делиберативные агенты используют символьную модель окружающей среды и основанные на этой модели методы прогнозирования событий и планирования действий. Класс таких архитектур достаточно широк. СИМ МАС не накладывает никаких ограничений на выбор конкретной архитектуры ИПА, этот выбор целиком определяется разработчиком агентной системы. Вместе с тем для ряда широко известных типовых архитектур процесс проектирования ИПА поддерживается в СИМ МАС соответствующими шаблонами и библиотеками классов.

Подсистема разработки
ИПА

Подсистема разработки
ФПА

Модуль конфигурирования среды
исполнения

Среда разработки СИМ МАС

Интеллектуальная подсистема
агента

Данные восприятия
Команды

ССееннссооррыы

ААкктутауытаотроыр

Модель физического носителя ИА

ОвОвнсбнсербъершеъешедекндыкнтеытеыйый

Физическаагяенптоадсистема

Сервер моделирования

Среда исполнения СИМ МАС
Подсистема визуализации СИМ МАС

Лог-файлы ментальной деятельности агентов

Лог-файлы сеансов моделирования сервера

Подсистема интерпретации
лог-файлов

Рис. 1. Архитектура СИМ МАС
На первом шаге проектирования выбирается базовая архитектура, тем самым определяется состав подсистем ИПА и базовый ментальный цикл. Например, архитектура, основанная на полезности [1], включает подсистемы оценки обстановки, прогнозирования, планирования. На втором этапе выполняется разработка отдельных подсистем ИПА. При построении разных подсистем используются различные модели представления и обработки знаний – семантические сети, продукционные системы, фреймы, а также различные модели обработки неопределенности. Программная архитектура допускает использование существующих инструментов построения систем, основанных на знаниях (CLIPS, JESS и др.). Среда разработки ИПА поддерживает редактирование баз знаний агентов и конфигурирование методов их обработки.
Среда исполнения обеспечивает реализацию сеансов моделирования и включает следующие основные компоненты: сервер моделирования, подсистему визуализации и подсистему интерпретации логфайлов сеансов моделирования. Модуль конфигурирования среды исполнения позволяет задавать длительность такта моделирования, режим работы подсистемы визуализации и логгирования процесса моделирования и т.п.

54 Научно-технический вестник Санкт-Петербургского государственного университета
информационных технологий, механики и оптики, 2012, № 1 (77)

М.Г. Пантелеев, Н.В. Кохтенко, С.В. Лебедев
Среда исполнения СИМ МАС имеет клиент-серверную архитектуру. В соответствии с требованиями масштабирования и обеспечения реального времени ИПА различных агентов МАС реализуются в отдельных процессах и могут выполняться на отдельных компьютерах локальной сети. Подсистема визуализации также поддерживает клиент-серверное взаимодействие с сервером моделирования и может быть реализована на выделенном сервере для отображения моделируемых процессов в 3D-графике, что требует значительных вычислительных ресурсов.
Подсистема интерпретации лог-файлов предназначена для воспроизведения сеансов моделирования вне режима реального времени с возможностью детального анализа динамики ментальной деятельности агентов. Поскольку моделирование состояния многоагентного физического мира и ментальной деятельности отдельных агентов в общем случае выполняется на разных компьютерах, лог-файлы этих процессов также сохраняются на разных компьютерах. Состав сохраняемой информации в общем случае зависит от выбранной архитектуры агента и моделей принятия решений. В частности, для архитектуры ИА, основанной на полезности, эта информация может включать варианты действий, текущие значения их полезности, прогнозируемые ситуации и др. В режиме последующего воспроизведения сеанса моделирования подсистема интерпретации лог-файлов работает с распределенной файловой системой и обеспечивает отображение физического процесса и состояния ментальной деятельности агентов в каждом такте. Базовый алгоритм работы сервера моделирования представлен на рис. 2.
В каждом такте моделирования через заданный интервал времени t сервер опрашивает порты, к которым подключены ИПА моделируемых агентов, и считывает поступившие от них команды. Такт работы сервера задает интервал, в рамках которого ИПА должны принимать сенсорные данные, обрабатывать их, вырабатывать решения и выдавать команды управления. На основе этих команд сервер вычисляет новые физические состояния всех агентов (состояния ФПА). При этом реализуемые модели агентов как систем ограниченной рациональности должны гарантировать выполнение цикла работы ИПА в рамках заданного такта моделирования.

Приём команд действий от ИПА

Команды выполнения действий

Прием команд управления сенсорами

Состояние

Пересчёт физического состояния агентов

сенсоров на основе текущего состояния и входных данных

Пересчет зоны восприятия сенсоров агентов

Предыдущее состояние агентов
Новое состояние агентов

Расчет сенсорных посылок всех агентов
Передача сенсорных посылок от сервера моделирования к ИПА

Информация от сенсоров агента

Рис. 2. Базовый алгоритм работы сервера моделирования
Новые зоны сенсорного покрытия определяются для всех агентов с учетом нового пространственного положения агентов и режимов работы их сенсоров. При этом для каждого агента определяются объекты внешней среды, находящиеся в пределах зоны его восприятия, и вычисляются сенсорные данные с учетом заданной модели ошибок. СИМ МАС поддерживает возможность моделирования различных типов сенсоров, входящих в состав подсистемы восприятия (ПВсп) агента. Существенными особенностями имитационного моделирования сенсоров агентных систем являются:  ограниченность зон восприятия;  возможность управления режимами работы сенсора;  наличие ошибок (шумов) в воспринимаемой информации.
Среда разработки СИМ МАС поддерживает возможность создания новых типов сенсоров, а также использования при построении конкретного ИА существующих типов сенсоров с возможностью конфи-

Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики, 2012, № 1 (77)

55

СРЕДА ИМИТАЦИОННОГО МОДЕЛИРОВАНИЯ АГЕНТНЫХ СИСТЕМ …
гурирования их параметров. При создании имитационной модели сенсора задаются параметры зоны восприятия, характеристики объектов, воспринимаемые данным типом сенсора, и модель ошибок измеряемых параметров. При наличии у сенсора разных режимов работы для каждого из них определяются собственные характеристики.
В общем случае модель внесения погрешностей в получаемые сенсором данные имеет вид
 = f (d, R, P), где  – относительная погрешность, вносимая в измеряемые данные; d – расстояние до наблюдаемого объекта; R – режим работы сенсора; P – текущая характеристика помеховой обстановки; f – функция, описывающая зависимость величины погрешности от указанных выше параметров. При моделировании помеховой обстановки учитывается, что она может быть обусловлена как естественными шумами, так и помехами, целенаправленно создаваемыми другими агентами.
Моделируемая МАС может включать произвольное число агентов, при этом подсистема восприятия каждого агента может содержать любое число сенсоров различных типов. С учетом этого алгоритм работы сервера, реализующий моделирование восприятия агентов, представлен на рис. 3.

Множество сенсоров

Выбор очередного агента
Выбор первого сенсора в ПВсп агента

Множество агентов

Переход к следующему сенсору ПВсп

Шаг работы сенсора

нет да

Все сенсоры сработали

Буферизация данных. Подготовка посылки ПВсп к ИПА

нет да

Все агенты обработаны

Отправка сенсорных данных всех агентов
всем ИПА в цикле

Рис. 3. Алгоритм работы сервера в части моделирования восприятия агентов
Собранные в текущем такте сенсорные данные сериализуются и отсылаются ИПА соответствующих агентов через сокетные соединения. На основе полученных сообщений ИПА обновляет внутреннюю модель мира агента текущими значениями параметров наблюдаемых объектов, на основе которых вычисляются значения высокоуровневых параметров ситуации и выполняется ее оценка. Обобщенный алгоритм работы сенсора (рис. 4) выполняет обход графа сцены и выбор объектов, попавших в зону восприятия сенсора. Он реализован в составе шаблонного класса, на основе которого создаются модели конкретных сенсоров путем задания их параметров.
Для отработки моделей кооперативного поведения агентов, основанных на коммуникации, в СИМ МАС реализована возможность моделирования ненадежных каналов связи с ограниченной пропускной способностью. Поддерживается возможность моделирования, как широковещательных каналов связи, так и выделенных между парой агентов («точка–точка»). При создании модели канала связи в среде разработки задаются его характеристики, в частности: пропускная способность, вероятность безошибочной доставки сообщения, максимальная дальность связи (при моделировании радиоканалов) и др. Указанные характеристики могут описываться случайными величинами с задаваемыми параметрами распределения. Поддерживается возможность приема нескольких сообщений от различных агентов в одном такте моделирования.
На уровне среды исполнения модели каналов связи реализуются основным сервером моделирования. Для отправки сообщения агент посылает серверу соответствующую команду, содержащую передаваемое сообщение и идентификатор получателя. В следующем такте принимающий агент получает от сервера команду, содержащую переданное сообщение. При моделировании радиоканалов сервер добавляет во входное сообщение направление на источник и расстояние до него с внесением погрешностей относительно истинных значений. Таким образом, агенты имеют возможность с определенной степенью точности идентифицировать источник сообщения по его положению в пространстве.

56 Научно-технический вестник Санкт-Петербургского государственного университета
информационных технологий, механики и оптики, 2012, № 1 (77)

М.Г. Пантелеев, Н.В. Кохтенко, С.В. Лебедев

Инициализация работы сенсоров

1. Определение режима работы 2. Выбор модели внесения ошибок

Выбор очередного объекта из графа сцены

Дерево объектов

нет
да нет
да

Объект воспринимаем данным типом сенсора
Объект находится в зоне восприятия сенсора

Считывание значений параметров состояния объекта, необходимых сенсору

Вычисление значений параметров для передачи ИПА, воспринимаемых данным сенсором

Коррекция вычисленных значений в соответствии с моделью шумов
Сохранение вычисленных результатов в буфере

Модель ошибок

нет да

Все объекты графа сцены рассмотрены?

Сериализация данных из буфера и передача подсистеме восприятия агента

Временный буфер данных

Рис. 4. Базовый цикл работы модели сенсора

Заключение

Разрабатываемая среда имитационного моделирования позволяет исследовать модели автономного и группового поведения широкого класса интеллектуальных агентов с учетом реальных ограничений их сенсоров и каналов связи, поддерживает режим реального времени и возможность журналирования и анализа ментальной деятельности агентов в процессе принятия ими решений в динамических мирах. Реализованный прототип среды имитационного моделирования многоагентных систем был успешно апробирован при моделировании координируемых действий группы автономных беспилотных летательных аппаратов в условиях противодействия.

Литература

1. Рассел С., Норвиг П. Искусственный интеллект: Современный подход. – 2-е изд. Пер. с англ. – М.: Вильямс, 2006. – 1408 с.
2. Пузанков Д.В., Мирошников В.И., Пантелеев М.Г., Серегин А.В. Интеллектуальные агенты, многоагентные системы и семантический Web: концепции, технологии, приложения. – СПб: Технолит, 2008. – 292 с.
3. Uhrmacher Adelinde M., Weyns Danny. Multi-Agent Systems: Simulation and Applications // Computational Analysis, Synthesis and Design of Dynamic Modes. – Boca Raton: CRC Press, 2009. – 566 p.
4. Кельтон В., Лоу А. Имитационное моделирование. Классика CS. – 3-е изд. – СПб: Питер; Киев: BHV, 2004. – 847 с.

Пантелеев Михаил Георгиевич

– Санкт-Петербургский государственный электротехнический университет

«ЛЭТИ», кандидат технических наук, доцент, mpanteleyev@gmail.com

Кохтенко Николай Владимирович – Санкт-Петербургский государственный электротехнический университет

«ЛЭТИ», аспирант, nvkokhtenko@gmail.com

Лебедев Сергей Вячеславович

– Санкт-Петербургский государственный электротехнический университет

«ЛЭТИ», аспирант, lebedev.sv.etu@gmail.com

Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики, 2012, № 1 (77)

57