首页

公告通知

位置：首页 > 公告通知 > 正文

学术报告：机器学习之强化学习原理概述

2021-11-17

学术报告：机器学习之强化学习原理概述

报告人：张继文（高级工程师，东软集团）

报告时间：2020年11月17日（周三）13:30

报告地点：公共教学楼E101

报告摘要：强化学习（Reinforcement Learning），属于一种机器学习架构，它是通过让智能体（Agent）不断地对所处环境（Environment）进行探索和开发并根据反馈的回报（Reward）进行的一种经验学习。2016年,谷歌旗下DeepMind团队发布的AlphaGo以4：1的战绩击败了世界围棋冠军里李世纪石,引爆了强化学习的发展势头。近年来，不论在科研界还是工业界，强化学习发挥重要的作用。本报告简介强化学习的数学原理，以及动态规划、蒙特卡洛、时序差分等基本算法。在时间允许的情况下，将介绍DQN和Actor-Critic等深度强化学习算法。

主讲人简介: 张继文,1984年06月，博士生导师，国家青年特聘专家，国家优秀青年基金获得者。完成国家自然科学青年项目一项。以第一作者或通讯作者在《Automatica》、《Science China Information Sciences》、《Systems & Control Letters》等SCI期刊上发表论文10篇。

上一条：学术报告：从机器人控制系统到机器人操作系统

下一条：软件学院2020级硕士研究生学位论文开题报告会安排

首页

学院概况

师资队伍

学科专业

人才培养

科学研究

学生工作

招生就业

产教融合

校友工作

党群工作

学术报告：机器学习之强化学习原理概述

欢迎关注软件学院公众号