Поиск по всему репозиторию:
Модель координации поведения агентов на основе обучения с подкреплением
Открыть/скачать файлы документа
Автор
Научный руководитель
Головко, Владимир АдамовичДата издания
2012Издательство
БрГТУУДК
004Библиографическое описание
Кабыш, А. С. Модель координации поведения агентов на основе обучения с подкреплением / А. С. Кабыш ; науч. рук. В. А. Головко // Робототехника и искусственный интеллект. Проблемы и перспективы : материалы научно-практической конференции молодых ученых и студентов, Брест, 25–26 октября 2012 года / Министерство образования Республики Беларусь, Брестский государственный технический университет ; редкол.: В. С. Рубанов [и др.]. – Брест : БрГТУ, 2012. – С. 3–12. – Библиогр.: с. 12 (12 назв.).Аннотация
В данной работе описывается модель для нахождения оптимального поведения многоагентной структуры через организацию в ней оптимальных
взаимодействий между агентами. Модель включает две основные техники.
Модель графов координации позволяет явно выразить зависимость между
агентами, что позволяет разбить целевую функцию поведения в линейную
сумму индивидуальных целевых функций. Модель оценки влияний позволяет
оценить влияния других агентов на действия друг друга и в результате позволяет им координировать свои действия. В работе приведена реализация данной модели на основе обучения с подкреплением и экспериментальные результаты применения данной модели.
URI документа
https://rep.bstu.by/handle/data/893Документ расположен в коллекции
Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial» («Атрибуция-Некоммерчески») 4.0 Всемирная.