学术报告:机器学习之强化学习原理概述
报告人:张继文(高级工程师,东软集团)
报告时间:2020年11月17日(周三)13:30
报告地点:公共教学楼E101
报告摘要:强化学习(Reinforcement Learning),属于一种机器学习架构,它是通过让智能体(Agent)不断地对所处环境(Environment)进行探索和开发并根据反馈的回报(Reward)进行的一种经验学习。2016年,谷歌旗下DeepMind团队发布的AlphaGo以4:1的战绩击败了世界围棋冠军里李世纪石,引爆了强化学习的发展势头。近年来,不论在科研界还是工业界,强化学习发挥重要的作用。本报告简介强化学习的数学原理,以及动态规划、蒙特卡洛、时序差分等基本算法。在时间允许的情况下,将介绍DQN和Actor-Critic等深度强化学习算法。
主讲人简介: 张继文,1984年06月,博士生导师,国家青年特聘专家,国家优秀青年基金获得者。完成国家自然科学青年项目一项。以第一作者或通讯作者在《Automatica》、《Science China Information Sciences》、《Systems & Control Letters》等SCI期刊上发表论文10篇。