欢迎引用:
张祯毅, 黄捷. 基于行为的多差速机器人强化学习任务监管器设计[J]. 机器人, 2024, 46(4): 397-416, 424.
识别二维码,访问全文PDF
+ 图文导读
多差速机器人系统通过协同能够完成许多单机器人无法独立执行的任务,在物流、交通和巡检等场景具有良好的应用价值。然而在面对诸如智能工厂这类复杂场景带来的工作环境动态化和机器人任务需求高性能化,机器人任务目标变得更为复杂,多差速机器人系统常常要面对多个相互冲突任务的调解。
近日,福州大学5G+工业互联网研究院/电气工程与自动化学院黄捷教授团队在《机器人》上发表了题为“基于行为的多差速机器人强化学习任务监管器设计”的学术论文,其中论文的整体框图如图1所示。该论文的贡献可凝练为3点如下:(1)提出了具有非完整约束的零空间行为控制范式,保证了基本行为和复合行为的速度指令在理论上均不会违反非完整约束。(2)提出了多智能体强化学习任务监管器,学习了一个最优的联合行为优先级策略,智能且动态决策多差速机器人系统的行为优先级。(3)将所提出的理论用于实际的多差机器人,在3个Limo小车上实现了编队、避障和重构行为。
图1 多智能体强化学习监管器的整体框图
图3 本文方法在五个差速机器人场景下的仿真结果
福州大学5G+工业互联网研究院/电气工程与自动化学院博士研究生张祯毅为第一作者,福州大学黄捷教授为论文通信作者,本文得到了国家自然科学基金“未来工业互联网基础理论与关键技术”重大研究计划项目(批准号:92367109)的支持。
想了解更多,请点击下方“阅读原文”查看全文。
联系我们 :
电话:024-23970050
E-mail:jqr@sia.cn
网址:https://robot.sia.cn