關(guān)于我們
書單推薦
新書推薦
|
深度強(qiáng)化學(xué)習(xí)理論與實(shí)踐 讀者對象:本書可以作為理工科大學(xué)相關(guān)專業(yè)研究生的學(xué)位課教材, 也可以作為人工智能、機(jī)器學(xué)習(xí)相關(guān)專業(yè)高年級本科生的選修課教材, 還可以作為相關(guān)領(lǐng)域?qū)W術(shù)研究人員、教師和工程技術(shù)人員的參考資料
本書比較全面、系統(tǒng)地介紹了深度強(qiáng)化學(xué)習(xí)的理論和算法,并配有大量的案例和編程實(shí)現(xiàn)。全書核心內(nèi)容可以分為3部分,第一部分為經(jīng)典強(qiáng)化學(xué)習(xí),包括第2、3、4章,主要內(nèi)容有動(dòng)態(tài)規(guī)劃法,蒙特卡洛法、時(shí)序差分法;第二部分為深度強(qiáng)化學(xué)習(xí),包括第6、7、8章,主要內(nèi)容有值函數(shù)近似法、策略梯度法、策略梯度法進(jìn)階;第三部分重點(diǎn)介紹了深度強(qiáng)化學(xué)習(xí)的經(jīng)典應(yīng)用——AlphaGo系列算法。另外,作為理論和算法的輔助,第1章介紹了強(qiáng)化學(xué)習(xí)的模型,第5章簡單介紹了深度學(xué)習(xí)和PyTorch編程框架。
本書可以作為理工科大學(xué)相關(guān)專業(yè)研究生的學(xué)位課教材,也可以作為人工智能、機(jī)器學(xué)習(xí)相關(guān)專業(yè)高年級本科生的選修課教材,還可以作為相關(guān)領(lǐng)域?qū)W術(shù)研究人員、教師和工程技術(shù)人員的參考資料。
你還可能感興趣
我要評論
|