本書以人工智能方法解決博弈對(duì)抗問(wèn)題為主線,介紹策略搜索與機(jī)器博弈、機(jī)器學(xué)習(xí)與數(shù)據(jù)對(duì)抗、強(qiáng)化學(xué)習(xí)與對(duì)抗決策、博弈論與均衡策略計(jì)算等理論基礎(chǔ)以及其在求解博弈對(duì)抗問(wèn)題中的應(yīng)用,探討人工智能對(duì)軍事博弈對(duì)抗的影響。
更多科學(xué)出版社服務(wù),請(qǐng)掃碼獲取。
目錄
前言
第1章 緒論 1
1.1 相關(guān)概念與理解 1
1.1.1 智能 1
1.1.2 人工智能 3
1.1.3 機(jī)器智能 5
1.1.4 人機(jī)混合智能 6
1.1.5 群體智能 8
1.1.6 智能相關(guān)概念之間的關(guān)系 12
1.1.7 博弈對(duì)抗 13
1.2 人機(jī)對(duì)抗的興起與發(fā)展 14
1.2.1 棋牌類游戲人機(jī)對(duì)抗 14
1.2.2 電子競(jìng)技中的AI玩家 21
1.2.3 無(wú)人系統(tǒng)人機(jī)對(duì)抗 25
參考文獻(xiàn) 28
第2章 策略搜索與機(jī)器博弈 31
2.1 策略搜索技術(shù) 31
2.1.1 狀態(tài)空間和搜索樹(shù)的概念 31
2.1.2 無(wú)信息搜索 33
2.1.3 啟發(fā)式搜索 35
2.1.4 極小極大搜索 35
2.1.5 蒙特卡羅樹(shù)搜索 38
2.2 國(guó)際象棋 41
2.2.1 國(guó)際象棋求解技術(shù) 43
2.2.2 國(guó)際象棋引擎當(dāng)前發(fā)展 46
2.3 西洋跳棋 46
2.3.1 西洋跳棋的復(fù)雜度 47
2.3.2 西洋跳棋的“破解” 47
2.4 《吃豆人》游戲 49
參考文獻(xiàn) 51
第3章 機(jī)器學(xué)習(xí)與數(shù)據(jù)對(duì)抗 53
3.1 機(jī)器學(xué)習(xí)基礎(chǔ) 53
3.1.1 基本術(shù)語(yǔ) 54
3.1.2 典型任務(wù)形式 57
3.2 深度神經(jīng)網(wǎng)絡(luò)與對(duì)手行為預(yù)測(cè) 61
3.2.1 深度神經(jīng)網(wǎng)絡(luò) 61
3.2.2 對(duì)手行為預(yù)測(cè) 64
3.3 聚類算法與對(duì)手風(fēng)格預(yù)測(cè) 65
3.3.1 聚類算法 65
3.3.2 對(duì)手風(fēng)格聚類 66
3.4 深度偽造與應(yīng)對(duì)反制 68
3.4.1 深度偽造技術(shù)發(fā)展 68
3.4.2 深度偽造應(yīng)對(duì)與反制 72
3.5 對(duì)抗機(jī)器學(xué)習(xí) 74
3.5.1 對(duì)抗機(jī)器學(xué)習(xí)分類 75
3.5.2 主要技術(shù)分析 76
參考文獻(xiàn) 85
第4章 強(qiáng)化學(xué)習(xí)與對(duì)抗決策 87
4.1 強(qiáng)化學(xué)習(xí) 87
4.1.1 基于馬爾可夫決策過(guò)程的強(qiáng)化學(xué)習(xí)建模 87
4.1.2 模型求解方法 90
4.2 深度強(qiáng)化學(xué)習(xí) 94
4.2.1 DQN分析 95
4.2.2 DDPG分析 96
4.3 多智能體深度強(qiáng)化學(xué)習(xí) 97
4.3.1 隨機(jī)博弈建模 97
4.3.2 研究進(jìn)展 102
4.4 Atari游戲博弈 104
4.4.1 Atari游戲與AI 104
4.4.2 Atari游戲AI主要技術(shù)分析 106
4.5 圍棋博弈 109
4.5.1 AlphaGo分析 .110
4.5.2 AlphaGoZero分析 112
4.6 《星際爭(zhēng)霸》游戲?qū)?116
4.6.1 全流程對(duì)戰(zhàn)主要技術(shù)分析:AlphaStar 119
4.6.2 微觀管理主要技術(shù)分析 124
4.7 兵棋博弈對(duì)抗 126
4.7.1 兵棋AI興起與發(fā)展 127
4.7.2 智能兵棋系統(tǒng) 130
4.7.3 全國(guó)兵棋推演大賽智能體博弈賽及系統(tǒng) 136
參考文獻(xiàn) 138
第5章 博弈論與均衡策略計(jì)算 141
5.1 博弈論基礎(chǔ) 141
5.1.1 博弈論基本概念 141
5.1.2 博弈論基本假設(shè) 143
5.1.3 博弈問(wèn)題分類 144
5.2 典型博弈模型與解概念 145
5.2.1 策略型博弈 145
5.2.2 展開(kāi)型博弈 149
5.2.3 貝葉斯博弈 152
5.3 均衡策略計(jì)算方法 153
5.3.1 虛擬博弈系列技術(shù) 153
5.3.2 基于Q學(xué)習(xí)的均衡策略計(jì)算 154
5.3.3 虛擬遺憾值昀小化 156
5.4 德州撲克博弈 157
5.4.1 德州撲克基本規(guī)則 158
5.4.2 撲克博弈樹(shù) 159
5.4.3 德州撲克AI的技術(shù)路線 160
5.4.4 先進(jìn)德州撲 AI介紹 164
5.5 追逃博弈與微分對(duì)策 167
5.5.1 追逃博弈的例子 168
5.5.2 微分對(duì)策的基本概念 170
5.5.3 微分對(duì)策的解概念 171
參考文獻(xiàn) 173
第6章 人工智能對(duì)軍事博弈對(duì)抗的影響 176
6.1 人工智能技術(shù)的優(yōu)勢(shì)與挑戰(zhàn) 176
6.2 人工智能對(duì)當(dāng)前軍事領(lǐng)域的滲透 177
6.2.1 情報(bào)偵察監(jiān)視 177
6.2.2 指揮決策 178
6.2.3 任務(wù)執(zhí)行 178
6.2.4 網(wǎng)絡(luò)空間 179
6.2.5 后勤保障 180
6.3 人工智能對(duì)未來(lái)戰(zhàn)爭(zhēng)形態(tài)的改變 181
6.3.1 新型作戰(zhàn)概念 182
6.3.2 新型作戰(zhàn)樣式 186
6.4 人工智能武器 189
6.4.1 人工智能武器在全球的發(fā)展 189
6.4.2 人工智能武器的風(fēng)險(xiǎn)與挑戰(zhàn) 192
參考文獻(xiàn) 193