Search
Модель координации поведения агентов на основе обучения с подкреплением
View/ Open document files
Author
Scientific adviser
Головко, Владимир АдамовичDate
2012Publisher
БрГТУUDC
004Citation
Кабыш, А. С. Модель координации поведения агентов на основе обучения с подкреплением / А. С. Кабыш ; науч. рук. В. А. Головко // Робототехника и искусственный интеллект. Проблемы и перспективы : материалы научно-практической конференции молодых ученых и студентов, Брест, 25–26 октября 2012 года / Министерство образования Республики Беларусь, Брестский государственный технический университет ; редкол.: В. С. Рубанов [и др.]. – Брест : БрГТУ, 2012. – С. 3–12. – Библиогр.: с. 12 (12 назв.).Abstract
В данной работе описывается модель для нахождения оптимального поведения многоагентной структуры через организацию в ней оптимальных
взаимодействий между агентами. Модель включает две основные техники.
Модель графов координации позволяет явно выразить зависимость между
агентами, что позволяет разбить целевую функцию поведения в линейную
сумму индивидуальных целевых функций. Модель оценки влияний позволяет
оценить влияния других агентов на действия друг друга и в результате позволяет им координировать свои действия. В работе приведена реализация данной модели на основе обучения с подкреплением и экспериментальные результаты применения данной модели.
Collection
Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial» («Атрибуция-Некоммерчески») 4.0 Всемирная.