绑久久黄色网站视频,欧美黄色福利免费观看

內(nèi)容簡介
編輯推薦
序言
作者介紹
目錄

本書介紹強化學(xué)習(xí)理論及其Python實現(xiàn)。第1章: 從零開始介紹強化學(xué)習(xí)的背景知識, 介紹環(huán)境庫Gym的使用。第2-15章: 基于折扣獎勵離散時間Markov決策過程模型, 介紹強化學(xué)習(xí)的主干理論和常見算法。采用數(shù)學(xué)語言推導(dǎo)強化學(xué)習(xí)的基礎(chǔ)理論, 進而在理論的基礎(chǔ)上講解算法。Python實現(xiàn)和算法講解一一對應(yīng), 針對深度強化學(xué)習(xí)算法還給出了基于TensorFlow 2和PyTorch 1的對照實現(xiàn)。第16章: 介紹其他強化學(xué)習(xí)模型, 包括平均獎勵模型、連續(xù)時間模型、非齊次模型, 半Markov模型、部分可觀測模型等, 以便更好了解強化學(xué)習(xí)研究的全貌。

你還可能感興趣

高級Python核心編程：開啟精通Python編程世界之旅
LabVIEW 2018 虛擬儀器程序設(shè)計第2版
Python Qt GUI與數(shù)據(jù)可視化編程
Python Web開發(fā)從入門到精通
Python數(shù)據(jù)科學(xué)零基礎(chǔ)一本通

我要評論