Анализ времени работы метода динамического выбора переключающихся критериев оптимизации с помощью обучения с подкреплением
Аннотация
Существуют методы повышения эффективности однокритериальной оптимизации путем введения вспомогательных критериев. Одним из них является метод EA+RL, в котором для динамического выбора вспомогательного критерия применяется обучение с подкреплением. В идеале, вспомогательные критерии должны быть эффективными на всех этапах алгоритма, однако на практике критерии часто могут быть эффективными на одних этапах оптимизации и мешающими на других. Эффективность метода EA+RL была доказана теоретически на ряде модельных задач. Однако эффективность применения метода EA+RL в случае использования вспомогательных критериев, которые меняют эффективность в процессе оптимизации не была исследована. В данной работе проводится теоретический анализ времени работы метода EA+RL в случае использования таких критериев.