报 告人:付俊杰 教授
报告题目:基于模型加速安全强化学习的无人车轨迹跟踪控制
报告时间:2025年05月17日(周六)上午10:30
报告地点:腾讯会议411-195-263
主办单位:数学与统计学院、数学研究院、科学技术研究院
报告人简介:
付俊杰,东南大学教授,博导,教育部国家高层次人才,江苏省杰出青年基金获得者。2011年及2017年于北京大学工学院分别获学士和博士学位。2017年至今于东南大学任教。主要研究方向包括输入饱和多智能体分布式协同控制、分布式协同避障、分布式模型预测控制、多智能体安全强化学习等。至今共发表(含接收)SCI期刊论文50余篇,出版中文专著2部,英文专著章节1篇。申请国家发明专利11项(已授权6项)。主持国防项目、教育部装备预研联合基金、江苏省杰出青年基金项目、国家自然科学基金面上及青年项目等。曾获2022年中国指挥与控制学会科学技术进步一等奖(排2/15),2023年亚太神经网络学会青年研究奖,2022 ICUS 最佳会议论文奖(排1/2)等。担任国际SCI期刊The Innovation、 Intelligence and Robotics、无人系统技术等青年编委,IEEE SMC Magazine编委。目前为中国指挥与控制学会网络科学与工程专委会副总干事、IEEE Senior Member。
报告摘要:
对于复杂环境下存在动力学不确定性的无人车系统安全轨迹跟踪控制问题,传统自适应或者扰动补偿控制方法通常依赖于未知动力学及外界扰动项的一些先验信息,而鲁棒控制方法通常依赖于扰动上界并且控制输入具有一定保守性。基于强化学习方法的轨迹跟踪控制可以降低对系统动力学及环境信息的依赖,仅利用在线交互数据即可实现对控制策略的学习与训练。然而,强化学习过程中的探索步骤对于无人车运行过程中的安全性构成威胁,且强化学习算法通常需要大量样本才能实现策略网络收敛,可能带来过高的训练成本。本报告介绍近期提出的一种基于模型加速安全强化学习的无人车轨迹跟踪控制方法,能够实现策略网络训练过程中无人车系统的高安全性以及大幅提升策略网络训练速度。