Search
Коллективное поведение агентов на основе подкрепляющего обучения
View/ Open document files
Date
2008Publisher
БрГТУUDC
004.8.03220Citation
Кабыш, А. С. Коллективное поведение агентов на основе подкрепляющего обучения / А. С. Кабыш, В. А. Головко // Вестник Брестского государственного технического университета. Серия: Физика, математика, информатика. – 2008. – № 5. – С. 37–42.Abstract
В данной работе рассмотрен подход к обучению в многоагентных системах на основе подкрепляющего обучения. Подкрепляющее обучение позволяет агенту обучаться только через взаимодействие с внешней средой. В многоагентных системах группа агентов стремится достигнуть общей цели. Поэтому требуется модификация стандартного алгоритма подкрепляющего обучения в случае многоагентной системы. В данной работе был предложен такой алгоритм и показано его применение на случай целенаправленного передвижения группы агентов. Преимуществом такого алгоритма является его способность работать с нейронными сетями. В результате моделирования в поведении группы агентов наблюдались повторяющиеся паттерны поведения – «лидер», «группирование» и «последовательность действий».
Annotation in another language
In this paper we meet some discussion about agent and multiagent systems and how can be reached collective behavior applying reinforcement learning paradigm to this systems. So question arises how it is possible to modify reinforcement learning for group of agents that try to do some collective work, in example collective movement. In this case we build some simple model including group of moving cooperating agents, cooperation means that the one agent use data from another agent when making a decision at every step. Modified reinforcement learning can be used for group of cooperating agents, and we can see some interesting pattern of collective behavior, like “leader”, “grouping” and “chain of actions”.
Collection
- 2008 [32]
Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial» («Атрибуция-Некоммерчески») 4.0 Всемирная.