強(qiáng)化學(xué)習(xí)與深度學(xué)習(xí)
定 價(jià):59 元
- 作者:(日)小高知宏著;張小猛譯
- 出版時(shí)間:2019/7/1
- ISBN:9787111627180
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類:TP181
- 頁碼:159頁:圖;24m
- 紙張:膠版紙
- 版次:1
- 開本:16K
本書共4章。第1章介紹了人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)的基本概念。第2章以Q學(xué)習(xí)為例,重點(diǎn)介紹了強(qiáng)化學(xué)習(xí)的原理、算法步驟、代碼實(shí)現(xiàn)、代碼運(yùn)行調(diào)試。第3章先對深度學(xué)習(xí)的幾種常見的類型和原理進(jìn)行介紹,然后給出了例程和調(diào)試方法。第4章以Q學(xué)習(xí)中運(yùn)用神經(jīng)網(wǎng)絡(luò)為例,介紹了深度強(qiáng)化學(xué)習(xí)的基本原理和方法,同時(shí)也給出了例程和調(diào)試方法。
適讀人群 :想要獲得深度學(xué)習(xí)進(jìn)階知識、強(qiáng)化學(xué)習(xí)技術(shù)及其應(yīng)用實(shí)踐的學(xué)生、從業(yè)者,特別是立志從事AI相關(guān)行業(yè)的人士
在人工智能的學(xué)習(xí)熱潮中,深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)無疑是亮眼的兩個(gè)明星。掌握深度學(xué)習(xí)原理,理解強(qiáng)化學(xué)習(xí)概念,對于能夠在人工智能發(fā)展中立于有利之地的您,無疑是必須且非常重要的。《強(qiáng)化學(xué)習(xí)與深度學(xué)習(xí):通過C語言模擬》不僅綜合了兩種學(xué)習(xí)的概念,更重要是給出了多個(gè)有趣且生動(dòng)的案例,為您的學(xué)習(xí)鋪平了道路。
原書前言
近年來,被稱為“深度學(xué)習(xí)”的機(jī)器學(xué)習(xí)方法在諸多領(lǐng)域取得了成功。深度學(xué)習(xí)誕生 之初,在圖像處理領(lǐng)域中為圖像識別率取得歷史性突破做出了非常大的貢獻(xiàn)。隨后,隨著深 度學(xué)習(xí)的不斷發(fā)展,深度學(xué)習(xí)不局限于應(yīng)用在圖像處理領(lǐng)域,在各種各樣的機(jī)器學(xué)習(xí)應(yīng)用領(lǐng) 域都取得了非常顯著的成果。
在深度學(xué)習(xí)的成功案例中,有一個(gè)基于強(qiáng)化學(xué)習(xí)的深度學(xué)習(xí)技術(shù)應(yīng)用方向。強(qiáng)化學(xué)習(xí)是 單純從一系列行動(dòng)的結(jié)果進(jìn)行行動(dòng)知識學(xué)習(xí)的方法。在強(qiáng)化學(xué)習(xí)中引入深度學(xué)習(xí)的方法,一 般我們稱為深度強(qiáng)化學(xué)習(xí)。關(guān)于深度強(qiáng)化學(xué)習(xí)成功案例的應(yīng)用報(bào)道非常多,例如,通過運(yùn)用 深度強(qiáng)化學(xué)習(xí),計(jì)算機(jī)能夠在汽車轉(zhuǎn)向盤操控方面獲得超越人類的技能;通過運(yùn)用深度強(qiáng)化 學(xué)習(xí),可以制造出能夠打敗圍棋世界冠軍的AI圍棋棋手等。
本書首先對強(qiáng)化學(xué)習(xí)和深度學(xué)習(xí)的基礎(chǔ)知識進(jìn)行介紹,然后在此基礎(chǔ)上,再對深度強(qiáng)化 學(xué)習(xí)的原理和機(jī)制進(jìn)行具體說明。同時(shí),本書不僅僅是在概念上的說明,而是對具體算法用 C語言進(jìn)行了編碼和實(shí)現(xiàn),通過實(shí)際運(yùn)行代碼的方式去深入理解每一步的具體處理方法。
最后,本書能夠順利成書,離不開作者在福井大學(xué)的教育科研活動(dòng)中取得的經(jīng)驗(yàn)。在此 向福井大學(xué)的各位教職工和學(xué)生表示衷心的感謝。另外,借成書之際,也特別對Ohmsha出 版社的各位編輯表示由衷的感謝。最后,我也要感謝支持我寫作的家人們。
小高知宏
2017年9月
目錄
譯者序
原書前言
第1章 強(qiáng)化學(xué)習(xí)和深度學(xué)習(xí)
1.1 機(jī)器學(xué)習(xí)和強(qiáng)化學(xué)習(xí)
1.1.1 人工智能
1.1.2 機(jī)器學(xué)習(xí)
1.1.3 強(qiáng)化學(xué)習(xí)
1.2 深度學(xué)習(xí)
1.2.1 神經(jīng)網(wǎng)絡(luò)
1.2.2 深度學(xué)習(xí)的出現(xiàn)
1.3 深度強(qiáng)化學(xué)習(xí)
1.3.1 深度強(qiáng)化學(xué)習(xí)概述
1.3.2 深度強(qiáng)化學(xué)習(xí)的實(shí)現(xiàn)
1.3.3 基本機(jī)器學(xué)習(xí)系統(tǒng)的搭建實(shí)例———例題程序的執(zhí)行方法
第2章 強(qiáng)化學(xué)習(xí)的實(shí)例
2.1 強(qiáng)化學(xué)習(xí)和Q學(xué)習(xí)
2.1.1 強(qiáng)化學(xué)習(xí)的基本思想
2.1.2 Q學(xué)習(xí)的算法
2.2 Q學(xué)習(xí)實(shí)例
2.2.1 q21.c編程實(shí)例
2.2.2 目標(biāo)探尋問題的學(xué)習(xí)程序
第3章 深度學(xué)習(xí)技術(shù)
3.1 實(shí)現(xiàn)深度學(xué)習(xí)的技術(shù)
3.1.1 神經(jīng)細(xì)胞的活動(dòng)和階層型 神經(jīng)網(wǎng)絡(luò)
3.1.2 階層型神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)
3.1.3 階層型神經(jīng)網(wǎng)絡(luò)的編程實(shí) 例(1):單個(gè)神經(jīng)細(xì)胞的學(xué)習(xí)程序nn1.c
3.1.4 階層型神經(jīng)網(wǎng)絡(luò)的編程實(shí) 例(2):基于誤差逆?zhèn)鞑シǖ纳窠?jīng)網(wǎng)絡(luò)學(xué)習(xí)程序nn2.c
3.1.5 階層型神經(jīng)網(wǎng)絡(luò)的編程實(shí) 例(3):具有多個(gè)輸出的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)程序nn3.c
3.2 基于卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)
3.2.1 卷積神經(jīng)網(wǎng)絡(luò)的算法
3.2.2 卷積神經(jīng)網(wǎng)絡(luò)的編程實(shí)例
第4章 深度強(qiáng)化學(xué)習(xí)
4.1 基于強(qiáng)化學(xué)習(xí)和深度學(xué)習(xí)融合的深度強(qiáng)化學(xué)習(xí) 1
4.1.1 在Q學(xué)習(xí)中應(yīng)用神經(jīng)網(wǎng)絡(luò)
4.1.2 Q學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)的融合
4.2 深度強(qiáng)化學(xué)習(xí)的編程實(shí)例
4.2.1 岔路選擇問題的深度強(qiáng)化學(xué) 習(xí)程序q21dl.c
4.2.2 目標(biāo)探尋問題的深度強(qiáng)化學(xué) 習(xí)程序q22dl.c
參考文獻(xiàn)