深度學(xué)習(xí)在數(shù)字圖像處理中的應(yīng)用
定 價(jià):89 元
- 作者:馬龍華
- 出版時(shí)間:2022/6/1
- ISBN:9787121437083
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TN911.73
- 頁碼:304
- 紙張:
- 版次:01
- 開本:16開
深度學(xué)習(xí)憑借其在識(shí)別應(yīng)用領(lǐng)域中超高的預(yù)測(cè)準(zhǔn)確率,在圖像處理領(lǐng)域獲得了極大關(guān)注,這勢(shì)必將提升現(xiàn)有圖像處理系統(tǒng)的性能并開創(chuàng)新的應(yīng)用領(lǐng)域。利用卷積神經(jīng)網(wǎng)絡(luò)等深層神經(jīng)網(wǎng)絡(luò)的解決方案,可以逐漸取代基于算法可解釋的傳統(tǒng)圖像處理工作。盡管圖像預(yù)處理、后期處理和信號(hào)處理仍在大量采用現(xiàn)有方法,但在圖像分類應(yīng)用中,深度學(xué)習(xí)變得愈加重要。在該背景下,本書系統(tǒng)介紹了深度學(xué)習(xí)在數(shù)字圖像處理各個(gè)研究分支的應(yīng)用,包括圖像增強(qiáng)、圖像復(fù)原、圖像檢索、圖像壓縮、圖像分割、目標(biāo)檢測(cè)、動(dòng)作識(shí)別和圖像配準(zhǔn)等。每一部分都對(duì)傳統(tǒng)方法做了概述,并穿插介紹本書作者的研究成果,反映了深度學(xué)習(xí)在數(shù)字圖像處理各個(gè)研究分支的發(fā)展現(xiàn)狀。本書可作為高等院校具有一定計(jì)算機(jī)基礎(chǔ)的人工智能、自動(dòng)化、信號(hào)與信息處理、電子信息工程、計(jì)算機(jī)科學(xué)與技術(shù)、通信工程等專業(yè)的研究生或高年級(jí)本科生的教材或參考書,也可作為科研院所相關(guān)專業(yè)的科技工作者的參考書。
馬龍華,浙江大學(xué)寧波理工學(xué)院教授,主持和承擔(dān)國(guó)家自然科學(xué)基金面上項(xiàng)目3項(xiàng)、重點(diǎn)項(xiàng)目1項(xiàng),工信部"中國(guó)制造2025”新模式重大專項(xiàng)2項(xiàng),浙江省杰出青年基金和重點(diǎn)基金各1項(xiàng);獲省部級(jí)科技進(jìn)步獎(jiǎng)6項(xiàng),其中省部級(jí)二等獎(jiǎng)3項(xiàng)。
第1章 數(shù)字圖像處理概述 1
1.1 數(shù)字圖像的基本概念 1
1.1.1 數(shù)字圖像 1
1.1.2 獲取靜態(tài)數(shù)字圖像的方式 7
1.1.3 色彩及色彩模型 10
1.2 數(shù)字圖像的獲取與描述 15
1.2.1 圖像數(shù)字化 15
1.2.2 圖像灰度直方圖 17
1.2.3 圖像處理算法的形式 20
1.2.4 圖像的數(shù)據(jù)結(jié)構(gòu)與特征 21
1.3 數(shù)字圖像處理的研究?jī)?nèi)容和應(yīng)用領(lǐng)域 25
1.3.1 數(shù)字圖像處理的基本流程 25
1.3.2 數(shù)字圖像處理的研究分支 26
1.3.3 傳統(tǒng)數(shù)字圖像處理常用的理論工具 30
1.3.4 數(shù)字圖像處理的應(yīng)用領(lǐng)域 30
參考文獻(xiàn) 32
第2章 深度學(xué)習(xí)概述 33
2.1 深度學(xué)習(xí)的概念 33
2.1.1 深度學(xué)習(xí)的歷史背景 33
2.1.2 深度學(xué)習(xí)的基本思想 33
2.1.3 深度學(xué)習(xí)的本質(zhì)和優(yōu)勢(shì) 34
2.2 國(guó)內(nèi)外研究現(xiàn)狀 35
2.2.1 深度學(xué)習(xí)在語音識(shí)別領(lǐng)域的研究現(xiàn)狀 35
2.2.2 深度學(xué)習(xí)在圖像識(shí)別領(lǐng)域的研究現(xiàn)狀 37
2.2.3 深度學(xué)習(xí)在自然語言處理領(lǐng)域的研究現(xiàn)狀 40
2.3 深度學(xué)習(xí)典型模型結(jié)構(gòu)和訓(xùn)練算法 41
2.3.1 感知機(jī) 42
2.3.2 前饋神經(jīng)網(wǎng)絡(luò)之多層感知機(jī) 43
2.3.3 前饋神經(jīng)網(wǎng)絡(luò)之卷積神經(jīng)網(wǎng)絡(luò) 45
2.3.4 反饋深度網(wǎng)絡(luò) 48
2.3.5 雙向深度網(wǎng)絡(luò) 50
2.3.6 深度學(xué)習(xí)訓(xùn)練算法 55
2.4 深度學(xué)習(xí)的優(yōu)點(diǎn)和已有的應(yīng)用 57
2.4.1 深度學(xué)習(xí)的優(yōu)點(diǎn) 57
2.4.2 深度學(xué)習(xí)已有的典型應(yīng)用 57
2.5 深度學(xué)習(xí)存在的問題及未來研究方向 60
2.5.1 深度學(xué)習(xí)目前存在的問題 60
2.5.2 深度學(xué)習(xí)未來研究方向 61
參考文獻(xiàn) 62
第3章 基于深度學(xué)習(xí)的圖像增強(qiáng)與圖像恢復(fù) 66
3.1 圖像去噪 66
3.1.1 傳統(tǒng)圖像去噪方法概述 66
3.1.2 基于DnCNN的圖像去噪 69
3.1.3 基于CBDNet的圖像去噪 72
3.2 圖像去霧 74
3.2.1 傳統(tǒng)圖像去霧方法概述 74
3.2.2 基于DehazeNet的圖像去霧 77
3.2.3 基于EPDN的圖像去霧 79
3.2.4 基于PMS-Net的圖像去霧 80
3.3 圖像去模糊 82
3.3.1 傳統(tǒng)圖像去模糊方法概述 82
3.3.2 基于ResBlock的圖像去模糊 85
3.3.3 基于DAVANet的圖像去模糊 86
3.4 圖像增強(qiáng) 91
3.4.1 傳統(tǒng)圖像增強(qiáng)方法概述 91
3.4.2 基于Deep Bilateral Learning的圖像增強(qiáng) 94
3.4.3 基于Deep Photo Enhancer的圖像增強(qiáng) 96
3.4.4 基于Deep Illumination Estimation的圖像增強(qiáng) 97
參考文獻(xiàn) 99
第4章 基于深度學(xué)習(xí)的圖像檢索 105
4.1 圖像檢索的研究背景和研究現(xiàn)狀 105
4.1.1 圖像檢索的研究背景 105
4.1.2 為什么要引入深度學(xué)習(xí) 106
4.1.3 圖像檢索的研究現(xiàn)狀 106
4.2 圖像特征和相似性度量 108
4.2.1 原始數(shù)據(jù)層特征 108
4.2.2 物理層特征 109
4.2.3 語義層特征 110
4.2.4 圖像相似性度量 110
4.3 基于內(nèi)容的圖像檢索 111
4.3.1 基于顏色特征的圖像檢索 111
4.3.2 基于紋理特征的圖像檢索 113
4.3.3 基于形狀特征的圖像檢索 114
4.3.4 基于多特征的圖像檢索 115
4.3.5 基于視覺詞袋的圖像檢索 119
4.4 基于注意力機(jī)制和卷積神經(jīng)網(wǎng)絡(luò)的圖像檢索 122
4.4.1 注意力機(jī)制簡(jiǎn)介 122
4.4.2 圖像檢索中的注意力機(jī)制 123
4.4.3 基于注意力機(jī)制和卷積神經(jīng)網(wǎng)絡(luò)模型的圖像檢索 124
4.4.4 實(shí)驗(yàn)結(jié)果 127
4.5 基于深度信念網(wǎng)絡(luò)的人臉圖像檢索 130
4.5.1 局部二值模式 130
4.5.2 DBN訓(xùn)練模型 130
4.5.3 融合LBP算子與DBN網(wǎng)絡(luò)模型的圖像檢索 131
4.5.4 實(shí)驗(yàn)結(jié)果 131
參考文獻(xiàn) 132
第5章 基于深度學(xué)習(xí)的圖像壓縮 136
5.1 圖像壓縮概述 136
5.1.1 圖像壓縮的目的和意義 136
5.1.2 傳統(tǒng)圖像壓縮的方法分類和簡(jiǎn)介 137
5.1.3 為什么要引入深度學(xué)習(xí) 139
5.1.4 基于深度學(xué)習(xí)的圖像壓縮技術(shù)現(xiàn)狀 139
5.2 基于矢量量化的圖像壓縮方法 140
5.2.1 基于矢量量化的圖像壓縮概述 140
5.2.2 基于邊緣分類和范數(shù)排序的K-means算法的碼書設(shè)計(jì) 142
5.2.3 基于特征分類和分組初始化的改進(jìn)K-means算法的碼書設(shè)計(jì) 146
5.3 基于深度學(xué)習(xí)的圖像壓縮方法 151
5.3.1 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像壓縮方法概述 151
5.3.2 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的圖像壓縮方法概述 153
5.3.3 基于生成對(duì)抗網(wǎng)絡(luò)的圖像壓縮方法概述 154
5.3.4 結(jié)合卷積神經(jīng)網(wǎng)絡(luò)和傳統(tǒng)方法的圖像壓縮 155
5.3.5 實(shí)驗(yàn)結(jié)果與分析 159
參考文獻(xiàn) 161
第6章 基于深度學(xué)習(xí)的圖像分割 167
6.1 圖像分割概述 167
6.1.1 圖像分割的目的和意義 167
6.1.2 傳統(tǒng)圖像分割方法分類 168
6.1.3 典型傳統(tǒng)圖像分割方法簡(jiǎn)介 170
6.1.4 為什么引入深度學(xué)習(xí) 175
6.2 復(fù)雜背景下毛坯輪轂圖像分割及圓心精確定位 176
6.2.1 引言 176
6.2.2 基于超像素能量譜的輪轂分割 177
6.2.3 精確圓擬合算法 178
6.2.4 圓擬合結(jié)果分析 179
6.3 基于深度學(xué)習(xí)的圖像分割概述 181
6.3.1 研究現(xiàn)狀 181
6.3.2 幾種典型實(shí)現(xiàn)方案 182
6.3.3 基于全卷積神經(jīng)網(wǎng)絡(luò)的圖像分割實(shí)驗(yàn)結(jié)果 185
6.4 基于深度生成對(duì)抗網(wǎng)絡(luò)的超聲圖像分割 186
6.4.1 引言 186
6.4.2 相關(guān)工作 187
6.4.3 基于深度生成對(duì)抗網(wǎng)絡(luò)的臂叢分割 188
6.4.4 實(shí)驗(yàn) 190
參考文獻(xiàn) 193
第7章 基于深度學(xué)習(xí)的人臉檢測(cè)與行人檢測(cè) 198
7.1 基于深度學(xué)習(xí)的人臉檢測(cè) 198
7.1.1 人臉檢測(cè)概述 198
7.1.2 基于深度學(xué)習(xí)的人臉檢測(cè)算法分類和數(shù)據(jù)集 200
7.1.3 多任務(wù)級(jí)聯(lián)卷積網(wǎng)絡(luò)的加速 203
7.1.4 實(shí)驗(yàn)結(jié)果 209
7.2 行人檢測(cè)概述 212
7.2.1 行人檢測(cè)基本框架 212
7.2.2 基于傳統(tǒng)機(jī)器學(xué)習(xí)的方法 212
7.2.3 基于深度學(xué)習(xí)的方法 213
7.2.4 行人檢測(cè)評(píng)判標(biāo)準(zhǔn) 216
7.3 基于ViBe結(jié)合HOG+SVM的快速行人檢測(cè)與跟蹤 216
7.3.1 引言 216
7.3.2 ViBe算法 217
7.3.3 基于HOG+SVM的行人檢測(cè) 218
7.3.4 基于ViBe結(jié)合HOG+SVM方案 220
7.3.5 實(shí)驗(yàn)結(jié)果與分析 222
參考文獻(xiàn) 227
第8章 基于深度學(xué)習(xí)的動(dòng)作識(shí)別 232
8.1 人體動(dòng)作識(shí)別技術(shù)概述 232
8.1.1 引言 232
8.1.2 國(guó)內(nèi)外研究現(xiàn)狀 233
8.1.3 研究難點(diǎn) 236
8.2 動(dòng)作識(shí)別相關(guān)技術(shù) 237
8.2.1 圖卷積網(wǎng)絡(luò) 237
8.2.2 用于骨骼動(dòng)作識(shí)別的空時(shí)圖卷積網(wǎng)絡(luò) 239
8.2.3 用于視頻動(dòng)作識(shí)別的雙流卷積網(wǎng)絡(luò) 240
8.2.4 動(dòng)作識(shí)別相關(guān)數(shù)據(jù)集 241
8.3 人體姿態(tài)估計(jì) 244
8.3.1 人體姿態(tài)估計(jì)的分類 244
8.3.2 OpenPose算法 245
8.3.3 AlphaPose算法 248
8.3.4 實(shí)驗(yàn)結(jié)果比較分析 251
8.4 基于圖卷積網(wǎng)絡(luò)的骨骼序列動(dòng)作識(shí)別算法 253
8.4.1 引言 253
8.4.2 注意力機(jī)制和共現(xiàn)特征學(xué)習(xí) 253
8.4.3 基于圖卷積網(wǎng)絡(luò)的多任務(wù)框架 254
8.4.4 實(shí)驗(yàn)結(jié)果及分析 257
8.5 一種替代光流的視頻動(dòng)作識(shí)別算法 261
8.5.1 基于光流估計(jì)的雙流卷積網(wǎng)絡(luò) 261
8.5.2 時(shí)間軌跡濾波器 262
8.5.3 隨機(jī)跨幀融合 264
8.5.4 實(shí)驗(yàn)結(jié)果及分析 265
參考文獻(xiàn) 266
第9章 基于深度學(xué)習(xí)的醫(yī)學(xué)圖像配準(zhǔn) 270
9.1 醫(yī)學(xué)圖像配準(zhǔn)概述 270
9.1.1 基本概念 270
9.1.2 基本變換 270
9.1.3 方法分類 272
9.1.4 典型配準(zhǔn)方法 272
9.1.5 評(píng)估方法 273
9.2 基于分形沙漏網(wǎng)絡(luò)由MV-DR合成kV-DRR 274
9.2.1 引言 274
9.2.2 分形沙漏網(wǎng)絡(luò) 274
9.2.3 實(shí)驗(yàn) 276
9.3 基于公共表征學(xué)習(xí)和幾何約束的多模態(tài)醫(yī)學(xué)圖像配準(zhǔn) 278
9.3.1 引言 278
9.3.2 方法 279
9.3.3 實(shí)驗(yàn)及算法比較 280
9.4 基于信息瓶頸條件生成對(duì)抗網(wǎng)絡(luò)的MV-DR和kV-DRR配準(zhǔn) 281
9.4.1 引言 281
9.4.2 材料和方法 282
9.4.3 結(jié)果 287
參考文獻(xiàn) 290