Модель координации поведения агентов на основе обучения с подкреплением

Кабыш, Антон Сергеевич

Поиск по всему репозиторию:

Дата издания

2012

Издательство

БрГТУ

УДК

004

Показать полное описание

Библиографическое описание

Кабыш, А. С. Модель координации поведения агентов на основе обучения с подкреплением / А. С. Кабыш ; науч. рук. В. А. Головко // Робототехника и искусственный интеллект. Проблемы и перспективы : материалы научно-практической конференции молодых ученых и студентов, Брест, 25–26 октября 2012 года / Министерство образования Республики Беларусь, Брестский государственный технический университет ; редкол.: В. С. Рубанов [и др.]. – Брест : БрГТУ, 2012. – С. 3–12. – Библиогр.: с. 12 (12 назв.).

Аннотация

В данной работе описывается модель для нахождения оптимального поведения многоагентной структуры через организацию в ней оптимальных взаимодействий между агентами. Модель включает две основные техники. Модель графов координации позволяет явно выразить зависимость между агентами, что позволяет разбить целевую функцию поведения в линейную сумму индивидуальных целевых функций. Модель оценки влияний позволяет оценить влияния других агентов на действия друг друга и в результате позволяет им координировать свои действия. В работе приведена реализация данной модели на основе обучения с подкреплением и экспериментальные результаты применения данной модели.