導覽
近期變更
隨機頁面
新手上路
新頁面
優質條目評選
繁體
不转换
简体
繁體
3.148.107.229
登入
工具
閱讀
檢視原始碼
特殊頁面
頁面資訊
求真百科歡迎當事人提供第一手真實資料,洗刷冤屈,終結網路霸凌。
檢視 EasyRL强化学习教程 的原始碼
←
EasyRL强化学习教程
前往:
導覽
、
搜尋
由於下列原因,您沒有權限進行 編輯此頁面 的動作:
您請求的操作只有這個群組的使用者能使用:
用戶
您可以檢視並複製此頁面的原始碼。
{| class="wikitable" align="right" |- |<center><img src=https://www0.kfzimg.com/sw/kfz-cos/kfzimg/5181885/f6aadb2730f3bf68_s.jpg width="260"></center> <small>[https://book.kongfz.com/285561/7292444224 来自 孔夫子网 的图片]</small> |} 《'''EasyRL强化学习教程'''》,王琦,杨毅远,江季 著,出版社: 人民邮电出版社。 人民邮电出版社是全国优秀[[出版社]]、全国百佳图书出版单位。人民邮电出版社出版领域涵盖科技出版、教育出版、大众出版,涉及信息技术、[[通信]]、工业技术、科普<ref>[https://www.douban.com/group/topic/116170316/ 100部科普经典名著],豆瓣,2018-04-26</ref>、经济管理、摄影、艺术、运动与休闲、心理学、少儿、大中专教材等10余个出版门类,年出版[[图书]]<ref>[https://www.xuexila.com/lishi/zixun/ziliao/18945.html 图书的演变历史资料],学习啦,2017-06-07</ref>近万种。 ==内容简介== 强化学习作为机器学习及人工智能*域的*种重要方法,在游戏、自动驾驶、机器人路线规划等*域得到了广泛的应用。 强化学习作为机器学习及人工智能领域的一种重要方法,在游戏、自动驾驶、机器人路线规划等领域得到了广泛的应用。 本书结合了李宏毅老师的“深度强化学习”、周博磊[[老师]]的“强化学习纲要”、李科浇老师的“世界冠军带你从零实践强化学习”公开课的精华内容,在理论严谨的基础上深入浅出地介绍马尔可夫决策过程、蒙特卡洛方法、时序差分方法、Sarsa、Q 学习等传统强化学习算法,以及策略梯度、近端策略优化、深度Q 网络、深度确定性策略梯度等常见深度强化学习算法的基本概念和方法,并以大量生动有趣的例子帮助读者理解强化学习问题的建模过程以及核心算法的细节。 此外,本书还提供较为全面的习题解答以及Python 代码实现,可以让读者进行端到端、从理论到轻松实践的全生态学习,充分掌握强化学习算法的原理并能进行实战。 本书适合对强化学习感兴趣的读者阅读,也可以作为相关课程的配套教材。 ==作者介绍== 王琦 [[中国科学院大学]]硕士在读,Datawhale成员。主要研究方向为深度学习、数据挖掘。曾获中国大学生计算机设计大赛二等奖、亚太地区大学生数学建模竞赛 (APMCM)二等奖和“挑战杯”竞赛江苏省选拔赛二等奖,发表 SCI/EI 论文3篇。 杨毅远 清华大学硕士在读, Datawhale成员。主要研究方向为时空数据挖掘、智能传感系统、深度学习。曾获全国大学生智能汽车竞赛总冠军、中国国家奖学金,发表SCI/EI论文7篇,其中以第一作者身份在SCI的Q1区、Q2区及中国计算机学会(CCF)A、B类会议中发表论文4篇。 江季 北京大学硕士在读, Datawhale成员。主要研究方向为强化学习、机器人。曾获大学生电子设计竞赛——2018年嵌入式系统专题邀请赛(英特尔杯)一等奖,发表顶会论文1篇、专利2项。 ==参考文献== [[Category:040 類書總論;百科全書總論]]
返回「
EasyRL强化学习教程
」頁面