本書介紹了深度學習的基本理論、工程實踐及其在產(chǎn)業(yè)界的部署和應用。在深度學習框架的介紹中,書中結合代碼詳細講解了經(jīng)典的卷積神經(jīng)網(wǎng)絡、循環(huán)神經(jīng)網(wǎng)絡和基于自注意力機制的Transformer網(wǎng)絡及其變體。還介紹了這些模型在圖像分類、目標檢測、語義分割、欺詐檢測和語音識別等領域的應用。此外,書中還涵蓋了深度強化學習和生成對抗網(wǎng)絡的前沿進展。在系統(tǒng)工程和產(chǎn)業(yè)實踐方面,書中解釋了如何使用分布式系統(tǒng)訓練和部署模型以處理大規(guī)模數(shù)據(jù)。本書系統(tǒng)介紹了構建深度學習推理系統(tǒng)的過程,并結合代碼講解了分布式深度學習推理系統(tǒng)需要考慮的工程化因素,例如分布式問題和消息隊列,以及從工程化角度出發(fā)的解決方法。本書提供了每個經(jīng)典模型和應用實例的TensorFlow和PyTorch版本代碼,為深度學習初學者和算法開發(fā)者提供理論學習、代碼實踐和工程落地的指導與幫助。
本書既適合計算機、自動化、電子、通信、數(shù)學、物理等相關專業(yè)背景的研究生和高年級本科生,也適合那些希望從事或準備轉向人工智能領域的專業(yè)技術人員。
全面系統(tǒng)講解神經(jīng)網(wǎng)絡、卷積神經(jīng)網(wǎng)絡、循環(huán)神經(jīng)網(wǎng)絡、Transformer等經(jīng)典深度學習架構,同步配套TensorFlow與PyTorch代碼。
從理論到實戰(zhàn),突出系統(tǒng)工程在深度學習中的應用,手把手教你搭建深度學習系統(tǒng)。
無論是AlphaGo、生成對抗網(wǎng)絡,還是深度學習推理系統(tǒng)DeepGo,總有一項深度學習前沿技術讓你興奮不已。
黨的二十大報告指出:教育、科技、人才是全面建設社會主義現(xiàn)代化國家的基礎性、戰(zhàn)
略性支撐。必須堅持科技是第一生產(chǎn)力、人才是第一資源、創(chuàng)新是第一動力,深入實施科教
興國戰(zhàn)略、人才強國戰(zhàn)略、創(chuàng)新驅動發(fā)展戰(zhàn)略,這三大戰(zhàn)略共同服務于創(chuàng)新型國家的建設。
高等教育與經(jīng)濟社會發(fā)展緊密相連,對促進就業(yè)創(chuàng)業(yè)、助力經(jīng)濟社會發(fā)展、增進人民福祉具
有重要意義。
在本書中,筆者將帶領廣大讀者一起踏上一段奇妙而充滿挑戰(zhàn)的人工智能之旅,揭示人
工智能的神秘面紗。無論讀者是剛剛踏入人工智能領域的初學者,還是已經(jīng)在這個領域探索
多年的專業(yè)人士,本書都將為大家提供全面而深入的指導。
深度學習作為人工智能領域的重要分支,正以其卓越的能力和廣泛的應用引領著科技的
未來,然而,要想在這個領域取得真正突破和應用創(chuàng)新,僅僅依靠對理論知識的理解是遠遠
不夠的。作為一位專業(yè)的人工智能從業(yè)者,需要掌握工程化的技能,理解人工智能系統(tǒng)的整
體架構和開發(fā)流程。本書通過深入淺出的方式,結合豐富的實際案例和工程實踐,讓讀者能
夠真正上手完整的人工智能項目,掌握將深度學習理論應用于實際生產(chǎn)的關鍵技能。
在筆者的職業(yè)經(jīng)歷中,學術研究和產(chǎn)業(yè)實踐是緊密結合的。要將先進的深度學習模型轉
換為可行的人工智能產(chǎn)品,需要克服許多技術難題和工程挑戰(zhàn)。除了模型本身的優(yōu)化和創(chuàng)新,
深度學習系統(tǒng)的整體性能也是至關重要的,包括運算速度、規(guī)模化能力和穩(wěn)健性等。本書不
僅對深度學習的基礎理論進行了深入淺出的講解,還通過真實案例的工程實踐,向讀者展示
了構建完整人工智能系統(tǒng)的方法和技巧。
本書共10 章,旨在幫助讀者逐步掌握深度學習的核心知識和實際應用技能。第1~8 章
詳細講解深度學習的基本概念,包括神經(jīng)網(wǎng)絡、卷積神經(jīng)網(wǎng)絡、循環(huán)神經(jīng)網(wǎng)絡、Transformer
及深度學習的前沿技術。通過逐層深入的講解,讀者將從根本上了解這些概念的起源、發(fā)展
和應用。第9 章和第10 章著眼于真實世界的分布式系統(tǒng)與應用案例,通過具體的項目實
踐,引導讀者了解深度學習系統(tǒng)的構建過程,并將其應用于實際場景中。全書突出了深度學
習技術在醫(yī)療領域的應用,并搭配有真實項目案例。本書特別強調實踐的重要性,為讀者提
供豐富的圖示、示例代碼和視頻,幫助讀者快速掌握基本概念,并展開大規(guī)模實踐。通過這
些實戰(zhàn)案例,讀者將學會如何處理真實世界中的數(shù)據(jù)集、設計高效的模型架構,并解決實際
應用中的挑戰(zhàn)。本書第4 章的語音識別與語音評測部分及第8 章的大部分內容由徐罡博士撰
寫,以期為讀者提供全面、前沿的深度學習理論知識。
為了保證全書的權威性,全部課程代碼均經(jīng)過嚴格審閱。由于篇幅的局限性,本書所呈
VI
現(xiàn)的代碼沒有嚴格遵守PEP 8 規(guī)范,更加規(guī)范的代碼可參考隨書代碼庫。
資源下載提示
素材(源代碼)等資源:掃描目錄上方的二維碼下載。
在本書的寫作過程中,中國運載火箭技術研究院的李旗挺教授、透徹實驗室的王偉研究
員、北京航空航天大學的張澤文同學、加州大學圣地亞哥分校的楊若淇同學對本書的內容進
行了審閱,并貢獻了部分模型代碼,非常感謝他們的鼎力相助。與此同時還得到了清華大學
出版社趙佳霓編輯的幫助,在這里筆者對她表示由衷的感謝。
希望讀者通過本書的學習和實踐,掌握人工智能的核心知識和技能,成為行業(yè)中的領軍
人物,為未來的科技創(chuàng)新做出貢獻。期待與每位讀者共同探究人工智能的奧秘,開創(chuàng)美好的
未來。讓筆者帶領大家一同踏上人工智能的征程,探索無盡的可能性。
王書浩
2024 年1 月于北京
本書源代碼
第
1
章神經(jīng)網(wǎng)絡深入
1
11 打開深度學習之門
1
12 從優(yōu)化問題講起
6
121 牛頓與開普勒的對話
6
122 擬合與分類的數(shù)學模型
6
123 通過訓練數(shù)據(jù)優(yōu)化模型參數(shù)
8
124 優(yōu)化方法 13
13 深度神經(jīng)網(wǎng)絡 16
131 誰來做特征提取 16
132 人工神經(jīng)元與激活函數(shù) 17
133 神經(jīng)網(wǎng)絡及其數(shù)學本質 21
14 正則化方法 29
141 欠擬合與過擬合 29
142 正則化方法 31
143 一些訓練技巧 35
15 模型評價 36
151 評價指標的重要性 36
152 混淆矩陣 36
153 典型評價指標 38
16 深度學習能力的邊界 39
161 深度學習各領域的發(fā)展階段 39
162 不適用現(xiàn)有深度學習技術的任務 39
163 深度學習的未來 40
本章習題 41
第
2
章卷積神經(jīng)網(wǎng)絡——圖像分類與目標檢測 42
21 卷積的基本概念 42
VIII
211 卷積的定義 42
212 卷積的本質 43
213 卷積的重要參數(shù) 43
214 池化層 45
22 卷積神經(jīng)網(wǎng)絡 46
221 典型的卷積神經(jīng)網(wǎng)絡 47
222 LeNet 50
223 AlexNet 53
224 VGGNet 57
225 ResNet 63
226 能力對比 75
23 目標檢測 76
231 R-CNN 76
232 Fast R-CNN 78
233 Faster R-CNN 79
234 YOLO 79
本章習題 81
第
3
章卷積神經(jīng)網(wǎng)絡——語義分割 82
31 語義分割基礎 82
311 語義分割的應用領域 82
312 全卷積神經(jīng)網(wǎng)絡 83
313 反卷積與空洞卷積 83
314 U-Net 85
315 DeepLab v1 和v2 90
316 DeepLab v3 95
317 兩種架構的融合——DeepLab v3 101
32 模型可視化 108
321 卷積核可視化 109
322 特征圖可視化 109
323 表征向量可視化 109
324 遮蓋分析與顯著梯度分析 109
33 病理影像分割初探 110
331 病理——醫(yī)學診斷的“金標準” 110
332 病理人工智能的挑戰(zhàn) 111
333 真實模型訓練流程112
IX
34 自監(jiān)督學習 117
341 方法概述 117
342 自監(jiān)督學習算法介紹 118
35 模型訓練流程 123
351 成本函數(shù) 123
352 自動調節(jié)學習速率 123
353 模型保存與加載 123
本章習題 124
第
4
章高級循環(huán)神經(jīng)網(wǎng)絡 125
41 自然語言處理基礎 125
411 時間維度的重要性 125
412 自然語言處理 125
413 詞袋法 126
414 詞嵌入 127
42 循環(huán)神經(jīng)網(wǎng)絡 128
421 時序數(shù)據(jù)建模的模式 128
422 循環(huán)神經(jīng)網(wǎng)絡基本結構 128
423 LSTM 131
424 GRU 134
43 基于會話的欺詐檢測 137
431 欺詐的模式 137
432 技術挑戰(zhàn) 138
433 數(shù)據(jù)預處理 138
434 實踐循環(huán)神經(jīng)網(wǎng)絡 140
44 語音識別與語音評測 148
441 特征提取 148
442 模型結構 149
443 CTC 損失函數(shù) 151
本章習題 152
第
5
章分布式深度學習系統(tǒng) 153
51 分布式系統(tǒng) 153
511 挑戰(zhàn)與應對 153
512 主從架構 154
513 Hadoop 與Spark 154
X
52 分布式深度學習系統(tǒng) 157
521 CPU 與GPU 157
522 分布式深度學習 160
523 通信——對參數(shù)進行同步 164
53 微服務架構 165
531 微服務的基本概念 166
532 消息隊列 167
54 分布式推理系統(tǒng) 167
541 深度學習推理框架 167
542 推理系統(tǒng)架構 169
本章習題 171
第
6
章深度學習前沿 173
61 深度強化學習 173
611 強化學習概述 173
612 深度強化學習概述 174
613 任天堂游戲的深度強化學習 175
62 AlphaGo 176
621 為什么圍棋這么困難 176
622 AlphaGo 系統(tǒng)架構 177
623 AlphaGo Zero 181
63 生成對抗網(wǎng)絡 182
631 生成對抗網(wǎng)絡概述 182
632 典型的生成對抗網(wǎng)絡 182
64 未來在哪里 207
本章習題 210
第
7
章專題講座 211
71 DenseNet 211
72 Inception 216
73 Xception 230
74 ResNeXt 236
75 Transformer 240
本章習題 242
第
8
章Transformer
和它的朋友們 243
81 注意力模型 243
XI
811 看圖說話 243
812 語言翻譯 245
813 幾種不同的注意力機制 246
82 Transformer 250
821 自注意力機制和Transformer 250
822 Transformer 在視覺領域的應用 278
本章習題 293
第
9
章核心實戰(zhàn) 294
91 圖像分類 295
911 ImageNet 數(shù)據(jù)集概述 295
912 ImageNet 數(shù)據(jù)探索與預處理 295
913 模型訓練 299
914 模型測試 304
915 模型評價 307
916 貓狗大戰(zhàn)數(shù)據(jù)集 309
917 模型導出 310
92 語義分割 311
921 數(shù)字病理切片介紹311
922 數(shù)字病理切片預處理 314
923 樣本均衡性處理 317
924 模型訓練 319
925 模型測試 324
926 模型導出 331
本章習題 332
第10
章深度學習推理系統(tǒng) 333
101 整體架構 333
102 調度器模塊 334
103 工作節(jié)點模塊 340
104 日志模塊 347
本章習題 349
參考文獻 350
擴展資源二維碼 351