设为首页    |    加入收藏    |    联系我们
公告通知
位置: 首页 > 公告通知 > 正文

学术报告:机器学习之强化学习原理概述

2021-11-17

学术报告:机器学习之强化学习原理概述

报告人:张继文(高级工程师,东软集团)

报告时间:20201117日(周三)13:30

报告地点:公共教学楼E101

报告摘要:强化学习(Reinforcement Learning),属于一种机器学习架构,它是通过让智能体(Agent)不断地对所处环境(Environment)进行探索和开发并根据反馈的回报(Reward)进行的一种经验学习。2016年,谷歌旗下DeepMind团队发布的AlphaGo以4:1的战绩击败了世界围棋冠军里李世纪石,引爆了强化学习的发展势头。近年来,不论在科研界还是工业界,强化学习发挥重要的作用。本报告简介强化学习的数学原理,以及动态规划、蒙特卡洛、时序差分等基本算法。在时间允许的情况下,将介绍DQN和Actor-Critic等深度强化学习算法。

主讲人简介: 张继文,1984年06月,博士生导师,国家青年特聘专家,国家优秀青年基金获得者完成国家自然科学青年项目一项。以第一作者或通讯作者在《Automatica》、《Science China Information Sciences》、《Systems & Control Letters》等SCI期刊上发表论文10篇。


版权所有:沈阳工业大学软件学院

  • 欢迎关注软件学院公众号

版权所有:沈阳工业大学软件学院

手机版