關(guān)于我們
書(shū)單推薦
新書(shū)推薦

強(qiáng)化學(xué)習(xí):原理與Python實(shí)現(xiàn)

強(qiáng)化學(xué)習(xí):原理與Python實(shí)現(xiàn)

定  價(jià):89 元

叢書(shū)名:智能系統(tǒng)與技術(shù)叢書(shū)

        

  • 作者:肖智清
  • 出版時(shí)間:2019/7/1
  • ISBN:9787111631774
  • 出 版 社:機(jī)械工業(yè)出版社
  • 中圖法分類:TP181 
  • 頁(yè)碼:
  • 紙張:膠版紙
  • 版次:
  • 開(kāi)本:16開(kāi)
9
7
6
8
3
7
1
1
7
1
7
1
4

本書(shū)理論完備,涵蓋主流非深度強(qiáng)化學(xué)習(xí)算法和深度強(qiáng)化學(xué)習(xí)算法;實(shí)戰(zhàn)性強(qiáng),基于Python、Gym、TensorFlow 2等構(gòu)建,并有AlphaZero等綜合案例。全書(shū)共12章,主要內(nèi)容如下。

第1章:介紹強(qiáng)化學(xué)習(xí)的基礎(chǔ)知識(shí)與強(qiáng)化學(xué)習(xí)環(huán)境庫(kù)Gym的使用,并給出完整的編程實(shí)例。

第2~9章:介紹強(qiáng)化學(xué)習(xí)的理論知識(shí)。以Markov決策過(guò)程為基礎(chǔ)模型,覆蓋了所有主流強(qiáng)化學(xué)習(xí)理論和算法,包括資格跡等經(jīng)典算法和深度確定性梯度策略等深度強(qiáng)化學(xué)習(xí)算法。所有章節(jié)都提供了與算法配套的Python程序,使讀者完全掌握強(qiáng)化學(xué)習(xí)算法的原理與應(yīng)用。

第10~12章:介紹了多個(gè)熱門(mén)綜合案例,包括電動(dòng)游戲、棋盤(pán)游戲和自動(dòng)駕駛。算法部分涵蓋了在《自然》《科學(xué)》等權(quán)威期刊上發(fā)表的多個(gè)深度強(qiáng)化學(xué)習(xí)明星算法,包括AlphaGo的*改進(jìn)版AlphaZero。


 你還可能感興趣
 我要評(píng)論
您的姓名   驗(yàn)證碼: 圖片看不清?點(diǎn)擊重新得到驗(yàn)證碼
留言內(nèi)容