關(guān)于我們
書單推薦
新書推薦

深度強(qiáng)化學(xué)習(xí)理論與實(shí)踐

深度強(qiáng)化學(xué)習(xí)理論與實(shí)踐

定  價(jià):89 元

叢書名:計(jì)算機(jī)技術(shù)開發(fā)與應(yīng)用叢書

        

  • 作者:龍強(qiáng)、章勝
  • 出版時(shí)間:2023/3/1
  • ISBN:9787302625544
  • 出 版 社:清華大學(xué)出版社
  • 中圖法分類:TP181 
  • 頁碼:368
  • 紙張:
  • 版次:1
  • 開本:16開
9
7
6
8
2
7
5
3
5
0
4
2
4

讀者對象:本書可以作為理工科大學(xué)相關(guān)專業(yè)研究生的學(xué)位課教材, 也可以作為人工智能、機(jī)器學(xué)習(xí)相關(guān)專業(yè)高年級本科生的選修課教材, 還可以作為相關(guān)領(lǐng)域?qū)W術(shù)研究人員、教師和工程技術(shù)人員的參考資料

本書比較全面、系統(tǒng)地介紹了深度強(qiáng)化學(xué)習(xí)的理論和算法,并配有大量的案例和編程實(shí)現(xiàn)。全書核心內(nèi)容可以分為3部分,第一部分為經(jīng)典強(qiáng)化學(xué)習(xí),包括第2、3、4章,主要內(nèi)容有動(dòng)態(tài)規(guī)劃法,蒙特卡洛法、時(shí)序差分法;第二部分為深度強(qiáng)化學(xué)習(xí),包括第6、7、8章,主要內(nèi)容有值函數(shù)近似法、策略梯度法、策略梯度法進(jìn)階;第三部分重點(diǎn)介紹了深度強(qiáng)化學(xué)習(xí)的經(jīng)典應(yīng)用——AlphaGo系列算法。另外,作為理論和算法的輔助,第1章介紹了強(qiáng)化學(xué)習(xí)的模型,第5章簡單介紹了深度學(xué)習(xí)和PyTorch編程框架。
本書可以作為理工科大學(xué)相關(guān)專業(yè)研究生的學(xué)位課教材,也可以作為人工智能、機(jī)器學(xué)習(xí)相關(guān)專業(yè)高年級本科生的選修課教材,還可以作為相關(guān)領(lǐng)域?qū)W術(shù)研究人員、教師和工程技術(shù)人員的參考資料。
 你還可能感興趣
 我要評論
您的姓名   驗(yàn)證碼: 圖片看不清?點(diǎn)擊重新得到驗(yàn)證碼
留言內(nèi)容