Search
Алгоритмы подкрепляющего обучения для энергоэффективного управления многоколесными производственными роботами
View/ Open document files
Date
2013Publisher
БрГТУUDC
004.853Citation
Алгоритмы подкрепляющего обучения для энергоэффективного управления многоколесными производственными роботами / В. В. Демин [и др.] // Вестник Брестского государственного технического университета. Серия: Физика, математика, информатика. – 2013. – №5. – С. 67–71.Abstract
Рассматривается система эффективного управления мобильным роботом с множеством движущих модулей, которые управляются независимо. В основе системы управления лежат алгоритмы обучения с подкреплением для поиска оптимальных политик управления каждого модуля. В рамках предлагаемого подхода модули рассматриваются как много агентная система, в которой координация поведений агентов осуществляется виртуальным лидером. Предложена модифицированная модель обучения с подкреплением для адаптивной координации индивидуальных стратегий. Модифицированный Q-learning алгоритм проводит обучение агентов эффективному управлению каждым колесом, в контексте группы, что позволяет агентам подстраиваться друг под друга. Разработанная система управления позволяет стабильно управлять роботом со сложной кинематической схемой и переменным количеством модулей. Эксперименты с разработанной системой были поставлены на реальном производственном роботе университета Равенсбург-Вайнгартен. Успешность моделирования и экспериментальной части показывает применимость подхода для реальных систем.
Annotation in another language
This paper presents an application of the multi-agent reinforcement learning approach for the efficient control of a real production mobile robot. This
approach is based on a multi-agent decomposition applied to multi-wheel control. System efficiency achieved through proper compilation of the value
function. Experiments shows that developed system provide stable robust control for complex kinematics.
Collection
- 2013 [20]
Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial» («Атрибуция-Некоммерчески») 4.0 Всемирная.