關(guān)于我們
書單推薦
新書推薦

強化學(xué)習(xí)

強化學(xué)習(xí)

定  價:129 元

叢書名:智能系統(tǒng)與技術(shù)叢書

        

  • 作者:肖智清著
  • 出版時間:2023/6/1
  • ISBN:9787111728917
  • 出 版 社:機械工業(yè)出版社
  • 中圖法分類:TP311.561 
  • 頁碼:490
  • 紙張:
  • 版次:1
  • 開本:24cm
9
7
7
8
2
7
8
1
9
1
1
1
7

讀者對象:本書適用于AI與大數(shù)據(jù)算法工程師、愛好者

本書介紹強化學(xué)習(xí)理論及其Python實現(xiàn)。第1章: 從零開始介紹強化學(xué)習(xí)的背景知識, 介紹環(huán)境庫Gym的使用。第2-15章: 基于折扣獎勵離散時間Markov決策過程模型, 介紹強化學(xué)習(xí)的主干理論和常見算法。采用數(shù)學(xué)語言推導(dǎo)強化學(xué)習(xí)的基礎(chǔ)理論, 進而在理論的基礎(chǔ)上講解算法。Python實現(xiàn)和算法講解一一對應(yīng), 針對深度強化學(xué)習(xí)算法還給出了基于TensorFlow 2和PyTorch 1的對照實現(xiàn)。第16章: 介紹其他強化學(xué)習(xí)模型, 包括平均獎勵模型、連續(xù)時間模型、非齊次模型, 半Markov模型、部分可觀測模型等, 以便更好了解強化學(xué)習(xí)研究的全貌。
 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內(nèi)容