Модель координации поведения агентов на основе обучения с подкреплением

Кабыш, Антон Сергеевич

Search

Date

2012

Publisher

БрГТУ

UDC

004

Show full item record

Citation

Кабыш, А. С. Модель координации поведения агентов на основе обучения с подкреплением / А. С. Кабыш ; науч. рук. В. А. Головко // Робототехника и искусственный интеллект. Проблемы и перспективы : материалы научно-практической конференции молодых ученых и студентов, Брест, 25–26 октября 2012 года / Министерство образования Республики Беларусь, Брестский государственный технический университет ; редкол.: В. С. Рубанов [и др.]. – Брест : БрГТУ, 2012. – С. 3–12. – Библиогр.: с. 12 (12 назв.).

Abstract

В данной работе описывается модель для нахождения оптимального поведения многоагентной структуры через организацию в ней оптимальных взаимодействий между агентами. Модель включает две основные техники. Модель графов координации позволяет явно выразить зависимость между агентами, что позволяет разбить целевую функцию поведения в линейную сумму индивидуальных целевых функций. Модель оценки влияний позволяет оценить влияния других агентов на действия друг друга и в результате позволяет им координировать свои действия. В работе приведена реализация данной модели на основе обучения с подкреплением и экспериментальные результаты применения данной модели.