導覽
近期變更
隨機頁面
新手上路
新頁面
優質條目評選
繁體
不转换
简体
繁體
18.226.172.2
登入
工具
閱讀
檢視原始碼
特殊頁面
頁面資訊
求真百科歡迎當事人提供第一手真實資料,洗刷冤屈,終結網路霸凌。
檢視 强化学习的数学原理英文版 的原始碼
←
强化学习的数学原理英文版
前往:
導覽
、
搜尋
由於下列原因,您沒有權限進行 編輯此頁面 的動作:
您請求的操作只有這個群組的使用者能使用:
用戶
您可以檢視並複製此頁面的原始碼。
{| class="wikitable" align="right" |- |<center><img src=https://www0.kfzimg.com/sw/kfz-cos/kfzimg/eeddfbfe/83f1a9a5bc12bfe5_s.jpg width="260"></center> <small>[https://book.kongfz.com/533713/7382518571 来自 孔夫子网 的图片]</small> |} 《'''强化学习的数学原理英文版'''》,作者赵世钰,责编郭赛,定价118.00,ISBN号9787302658528,出版社清华大学出版社,版印次1版 1次,开本16开,装帧平装,页数301,出版时间2024-07,印刷时间2024-07。 清华大学出版社成立于1980年6月,是教育部主管、[[清华大学]]主办的综合性大学出版社<ref>[http://www.zhongyw.com.cn/news/show-53574.html 我国出版社的等级划分和分类标准],知网出书,2021-03-01</ref>。清华社现年出版图书、音像制品、电子出版物等近3000种,[[销售]]规模和综合实力以及在高等教育教材市场、科技图书市场、馆配图书市场占有率均名列前茅<ref>[http://www.tup.tsinghua.edu.cn/aboutus/qyjj.html 企业简介],清华大学出版社有限公司</ref>。 ==内容简介== 本书从强化学习最基本的概念开始介绍,将介绍基础的分析工具,包括贝尔曼公式和贝尔曼最优公式,然后推广到基于模型的和无模型的强化学习算法,最后推广到基于[[函数]]逼近的强化学法。本书强调从数学的角度引入概念、分析问题、分析算法,并不强调算法的编程实现。本书不要求读者具备任何关于强化学习的知识背景,仅要求读者具备一定的概率论和线性代数的知识。如果读者已经具备强化学习的学习基础,本书可以帮助读者更深入地理解一些问题并提供新的视角。 本书面向对强化学习感兴趣的本科生、研究生、研究人员和企业或研究所的从业者。 ==作者介绍== 赵世钰,[[西湖大学工学院]]AI分支特聘研究员,智能无人系统实验室负责人,国家海外高层次人才引进计划青年项目获得者;本硕毕业于北京航空航天大学,博士毕业于新加坡国立大学,曾任英国谢菲尔德大学自动控制与系统工程系Lecturer;致力于研发有趣、有用、有挑战性的下一代机器人系统,重点关注多机器人系统中的控制、决策与感知等问题。 ==参考文献== [[Category:040 類書總論;百科全書總論]]
返回「
强化学习的数学原理英文版
」頁面