強化學習算法入門檢視原始碼討論檢視歷史

來自孔夫子網的圖片

《強化學習算法入門》，曾我部東馬著，段瓊譯，出版社：中國水利水電出版社。

中國水利水電出版社有限公司（China Water & Power Press）是中央級科技出版社^[1]。其前身是1956年元旦成立的水利出版社。1993年被中宣部、新聞出版署評選為首批15家「全國優秀出版單位」之一^[2]。

內容簡介

作為第一個戰勝圍棋世界冠軍的人工智能機器人AlphaGo，我們知道其主要工作原理是深度學習。隨着AlphaGo Zero和Alpha Zero的相繼發布，作為機器學習經典算法之一的強化學習，在人工智能領域受到了更多的關注。

《強化學習算法入門》使用通俗易懂的語言，按照「原理-公式-程序」的方式，對強化學習的基礎知識進行了詳細講解。書中先讓大家從熟悉的「平均值計算」作為切入點，學習強化學習的基本概念，然後結合實例學習了函數近似方法、深度強化學習的原理和方法等，比較了各算法的特點和應用，並用Python和MATLAB兩種語言進行了編程實現。

《強化學習算法入門》內容豐富，實踐性強，特別適合高校人工智能相關專業學生，機器學習、深度學習工程師等學習強化學習算法。

作者介紹

[日] 曾我部東馬

理學博士(物理學專業)。曾任馬克斯·普朗克研究所（德國）博士研究員、劍橋大學（英國）研究員。2009年回到日本，參與創立了Grid公司，擔任董事兼首席技術官。2011年起先後擔任東京大學尖端科學技術研究中心特聘助理教授、特聘副教授。2016年3月起任電氣通信大學副教授，同時兼任Grid公司首席技術顧問、東京大學尖端科學技術研究中心客座研究員至今。

他以開發具有「深度學習—深度強化學習—回歸預測—優化」功能的跨功能機器學習框架∞ReNom而聞名，目前在開發以量子機器學習為代表的最先進量子算法∞ReNomQ的同時，還致力於使用深度強化學習的「在線優化問題」的研究。

參考文獻

↑ 我國出版社的等級劃分和分類標準，知網出書，2021-03-01
↑ 中國水利水電出版社有限公司簡介，中國水利水電出版社

[1] 我國出版社的等級劃分和分類標準，知網出書，2021-03-01

[2] 中國水利水電出版社有限公司簡介，中國水利水電出版社

[1]

[2]

強化學習算法入門檢視原始碼討論檢視歷史

目錄

內容簡介

作者介紹

參考文獻