關(guān)于我們
書(shū)單推薦
新書(shū)推薦

現(xiàn)場(chǎng)實(shí)操:Python深度強(qiáng)化學(xué)習(xí)入門(mén):強(qiáng)化學(xué)習(xí)和深度學(xué)習(xí)的搜索與控制

現(xiàn)場(chǎng)實(shí)操:Python深度強(qiáng)化學(xué)習(xí)入門(mén):強(qiáng)化學(xué)習(xí)和深度學(xué)習(xí)的搜索與控制

定  價(jià):89 元

        

  • 作者:伊藤多一 等
  • 出版時(shí)間:2022/4/1
  • ISBN:9787111700722
  • 出 版 社:機(jī)械工業(yè)出版社
  • 中圖法分類:TP311.561 
  • 頁(yè)碼:240
  • 紙張:
  • 版次:
  • 開(kāi)本:16
9
7
7
8
0
7
0
1
7
1
2
1
2

讀者對(duì)象:人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)相關(guān)專業(yè)領(lǐng)域的技術(shù)人員和愛(ài)好者

《Python深度強(qiáng)化學(xué)習(xí)入門(mén):強(qiáng)化學(xué)習(xí)和深度學(xué)習(xí)的搜索與控制》共7章。其中,第1章介紹了機(jī)器學(xué)習(xí)的分類、強(qiáng)化學(xué)習(xí)的學(xué)習(xí)機(jī)制以及深度強(qiáng)化學(xué)習(xí)的概念;第2章通過(guò)強(qiáng)化學(xué)習(xí)的基本概念、馬爾科夫決策過(guò)程和貝爾曼方程、貝爾曼方程的求解方法、無(wú)模型控制等介紹了強(qiáng)化學(xué)習(xí)的基本算法;第3章通過(guò)深度學(xué)習(xí)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)介紹了強(qiáng)化學(xué)習(xí)中深度學(xué)習(xí)的特征提取方法;第4章通過(guò)行動(dòng)價(jià)值函數(shù)的網(wǎng)絡(luò)表示、策略函數(shù)的網(wǎng)絡(luò)表示介紹了深度強(qiáng)化學(xué)習(xí)的實(shí)現(xiàn);第5章通過(guò)策略梯度法的連續(xù)控制、學(xué)習(xí)算法和策略模型等,詳細(xì)介紹了深度強(qiáng)化學(xué)習(xí)在連續(xù)控制問(wèn)題中的應(yīng)用及具體實(shí)現(xiàn);第6章通過(guò)巡回推銷(xiāo)員問(wèn)題和魔方問(wèn)題詳細(xì)介紹了深度強(qiáng)化學(xué)習(xí)在組合優(yōu)化中的應(yīng)用及具體實(shí)現(xiàn);第7章通過(guò)SeqGAN的文本生成和神經(jīng)網(wǎng)絡(luò)的架構(gòu)搜索詳細(xì)介紹了深度強(qiáng)化學(xué)習(xí)在時(shí)間序列數(shù)據(jù)生成的應(yīng)用。在附錄中還給出了Colaboratory和Docker等深度強(qiáng)化學(xué)習(xí)開(kāi)發(fā)環(huán)境的構(gòu)建。
 你還可能感興趣
 我要評(píng)論
您的姓名   驗(yàn)證碼: 圖片看不清?點(diǎn)擊重新得到驗(yàn)證碼
留言內(nèi)容