Математическое и программное обеспечение новых информационных технологий
Правильная ссылка на статью:
Степанов П.П. Применение алгоритмов группового управления и машинного обучения на примере игры "Battlecode" // Кибернетика и программирование. 2019. № 1. С.75-82. DOI: 10.25136/2644-5522.2019.1.23527 URL: https://nbpublish.com/library_read_article.php?id=23527
Аннотация:
Предметом исследования являются задача группового управления автономными агентами в динамичной мультиагентной системе и самообучение модели управления. Автор подробно рассматривает такие аспекты проблемы как групповое взаимодействие, на примере наиболее эффективных алгоритмов групповго управления, таких как SWARM, муравьиный алгоритм, пчелиный алгоритм, алгоритм светлячков и алгоритм движения косяка рыб, и обучение искусственной нейронной сети, посредством применения обучения с подкреплением. Проведено сравнение различных алгоритмов поиска оптимального пути. Сравнение было проведено на основе игровой среды "Battlecode", динамично формирующей новую карту для нового раунда, что обеспечило качество сравнения рассмотренных алгоритмов. Автор использует статистические методы анализа данных, выделение и анализ качественных признаков, методы прогнозирования, метод моделирования, метод классификации. Автор показывет, что Q-обучение увеличивает свою эффективность, при замене табличного представления Q-функции на нейронную сеть. Проведенная работа доказывает эффективность пчелиного алгоритма в решении задачи исследования и патрулирования местности. При этом алгоритм поиска пути А* оказывается значительно более гибким и эффективным, чем алгоритм Дейкстры.
Ключевые слова:
групповое управление, нейронная сеть, обучение с подкреплением, игровой искусственный интеллект, пчелиный алгоритм, муравьиный алгоритм, мультиагентная система, Battlecode, моделирование, агент
Abstract:
The subject of the research is the task of group management of autonomous agents in a dynamic multi-agent system and self-study of the management model. The author examines such aspects of the problem as a group interaction, using the example of the most effective group control algorithms, such as SWARM, ant algorithm, bee algorithm, firefly algorithm and fish school movement algorithm, and training of an artificial neural network through the use of reinforcement training. A comparison of various algorithms for finding the optimal path. The comparison was made on the basis of the gaming environment "Battlecode", which dynamically forms a new map for the new round, which ensured the quality of the comparison of the considered algorithms. The author uses statistical methods of data analysis, the selection and analysis of qualitative signs, forecasting methods, modeling method, classification method. The author shows that Q-learning increases its effectiveness by replacing the tabular representation of the Q-function with a neural network. This work proves the effectiveness of the bee algorithm in solving the problem of researching and patrolling the area. At the same time, the path search algorithm A* is much more flexible and efficient than the Dijkstra algorithm.
Keywords:
multiagent system, ant algorithm, bee algorithm, game artificial intellegence, reinforcement learning, neural network, group management, Battlecode, modeling, agent