Например, Бобцов

Анализ времени работы метода динамического выбора переключающихся критериев оптимизации с помощью обучения с подкреплением

Сборник тезисов
Конференция:VI Всероссийский конгресс молодых ученых
Раздел:Информационные и интеллектуальные системы и технологии
Рубрика:Технологии программирования, искусственный интеллект, биоинформатика
Год:2016

Анализ времени работы метода динамического выбора переключающихся критериев оптимизации с помощью обучения с подкреплением

УДК:004.85

Аннотация

Существуют методы повышения эффективности однокритериальной оптимизации путем введения вспомогательных критериев. Одним из них является метод EA+RL, в котором для динамического выбора вспомогательного критерия применяется обучение с подкреплением. В идеале, вспомогательные критерии должны быть эффективными на всех этапах алгоритма, однако на практике критерии часто могут быть эффективными на одних этапах оптимизации и мешающими на других. Эффективность метода EA+RL была доказана теоретически на ряде модельных задач. Однако эффективность применения метода EA+RL в случае использования вспомогательных критериев, которые меняют эффективность в процессе оптимизации не была исследована. В данной работе проводится теоретический анализ времени работы метода EA+RL в случае использования таких критериев.

Материалы конференций