定 價:128 元
叢書名:工業(yè)和信息化部“十四五”規(guī)劃教材
- 作者:劉穎,李娜 等
- 出版時間:2023/11/1
- ISBN:9787030766397
- 出 版 社:科學出版社
- 中圖法分類:TN911.73
- 頁碼:332
- 紙張:
- 版次:31
- 開本:B5
本書以圖像視頻處理的基本原理為主線,以實際應用為擴展,以前沿技術動態(tài)為補充,介紹圖像視頻處理領域的研究熱點及關鍵技術。全書共11 章,分為四部分。第一部分包括第1~3 章,主要介紹圖像視頻處理的基本概念與理論。第二部分包括第4~8 章,主要介紹圖像處理的關鍵技術及其實際應用。第三部分包括第9、10 章,主要介紹視頻處理的關鍵技術及其實際應用。第四部分為第11 章,主要介紹多模態(tài)信息處理技術。
更多科學出版社服務,請掃碼獲取。
目錄
前言
第1章 緒論 1
1.1 引言 1
1.2基本概念 2
1.2.1圖像的基本概念 2
1.2.2視頻的基本概念 5
1.3數(shù)字圖像視頻處理技術的應用 6
1.3.1在智能交通領域的應用 6
1.3.2在公共安全領域的應用 8
1.3.3在教育領域的應用 9
1.3.4在醫(yī)療領域的應用 10
1.3.5在航空航天領域的應用 11
1.4本書的內(nèi)容及特色 12
思考題 12
參考文獻 12
第2章 圖像常用變換 14
2.1可分離變換和正交圖像變換 14
2.2傅里葉變換 16
2.2.1一維和二維傅里葉變換 16
2.2.2傅里葉變換定理 19
2.3離散余弦變換 24
2.3.1一維離散余弦變換 24
2.3.2二維離散余弦變換 27
2.4小波變換 28
2.4.1小波變換基礎 29
2.4.2一維小波變換 34
2.4.3快速小波變換 35
2.4.4二維小波變換 37
思考題 40
參考文獻 40
第3章 深度學習 42
3.1 引言 42
3.1.1基本概念 42
3.1.2反向傳播 44
3.1.3優(yōu)化學習 46
3.1.4深度學習發(fā)展史簡介 50
3.2深度學習技術 53
3.2.1卷積神經(jīng)網(wǎng)絡的基本原理 53
3.2.2池化層與全連接層 59
3.2.3 CNN示例計算 61
3.2.4常見的卷積神經(jīng)網(wǎng)絡 62
3.2.5 GAN 80
3.2.6 Transformer 82
3.3深度學習技術在圖像處理領域的應用 91
思考題 94
參考文獻 94
第4章 圖像增強處理 96
4.1 引言 96
4.1.1圖像增強處理的目的和意義 97
4.1.2圖像增強處理的常用方法 97
4.2直方圖均衡類圖像增強處理方法 99
4.2.1圖像直方圖的基本原理 99
4.2.2基于直方圖均衡化的圖像增強處理方法 100
4.3 Retinex類圖像增強處理方法 106
4.3.1 Retinex基本原理 106
4.3.2 基于 Retinex理論的圖像增強處理方法 107
4.4研究進展及實際應用 111
4.4.1前沿技術動態(tài)簡介 111
4.4.2實際應用示例 114
思考題 117
參考文獻 117
第5章 圖像水印技術 120
5.1數(shù)字圖像水印的概念、分類及應用 120
5.1.1數(shù)字圖像水印的概念 120
5.1.2數(shù)字圖像水印的分類 121
5.1.3數(shù)字圖像水印的應用 123
5.2常見數(shù)字圖像水印攻擊及性能評價 125
5.3傳統(tǒng)數(shù)字圖像水印算法 129
5.3.1數(shù)字圖像水印算法的一般模型 129
5.3.2數(shù)字圖像單水印算法 130
5.4數(shù)字圖像雙水印技術 137
5.5深度學習在數(shù)字圖像水印領域的應用 140
思考題 142
參考文獻 143
第6章 圖像檢索 144
6.1 引言 144
6.1.1圖像檢索研究背景 144
6.1.2圖像檢索研究意義 145
6.1.3 圖像檢索存在的問題 146
6.2圖像底層特征提取 148
6.3中層語義特征提取 153
6.3.1詞袋特征 153
6.3.2潛在語義特征 154
6.3.3稀疏編碼特征 155
6.4圖像檢索性能評價 156
6.4.1查全率和查準率 156
6.4.2 F得分 157
6.4.3 ROC曲線和 AUC 157
6.5應用實例 158
思考題 159
參考文獻 159
第7章 高光譜圖像處理 161
7.1 引言 161
7.1.1基本概念 161
7.1.2高光譜圖像的獲取原理 162
7.2高光譜圖像處理方法分類 164
7.2.1高光譜圖像解混 165
7.2.2高光譜圖像分類 167
7.2.3高光譜圖像異常目標檢測 169
7.3高光譜圖像解混應用示例 172
vi 數(shù)字圖像視頻處理及應用
7.3.1基于非負矩陣分解的解混算法 172
7.3.2 MVC-NMF算法 174
7.3.3 GNMF算法 175
7.3.4 GLNMF算法 176
7.3.5 EAGLNMF算法 177
7.4高光譜圖像異常目標檢測應用示例 189
7.4.1基于統(tǒng)計的線性異常目標檢測算法 189
7.4.2非線性異常目標檢測算法 189
7.4.3 GFM 192
思考題 198
參考文獻 198
第8章 高動態(tài)范圍圖像處理 202
8.1 引言 202
8.1.1高動態(tài)范圍概念 203
8.1.2高動態(tài)范圍圖像相關理論 204
8.1.3高動態(tài)范圍圖像獲取概述 206
8.2多曝光圖像生成 HDR圖像方法 208
8.2.1空間域生成 HDR圖像 211
8.2.2變換域生成 HDR圖像 215
8.2.3基于深度學習的多曝光圖像生成 HDR圖像 219
8.3單曝光圖像生成 HDR圖像方法 221
8.3.1傳統(tǒng)算法 221
8.3.2基于深度學習的單曝光圖像生成 HDR圖像 225
8.4高動態(tài)范圍圖像色調(diào)映射 228
8.4.1色調(diào)映射基礎 228
8.4.2經(jīng)典色調(diào)映射算法 230
思考題 235
參考文獻 235
第9章 視頻編碼與碼率控制 238
9.1視頻編碼 238
9.1.1基本原理 238
9.1.2視頻編碼標準發(fā)展歷程 241
9.1.3視頻編碼與碼率控制的關系 242
9.2碼率控制的目的 242
9.3碼率控制技術原理與發(fā)展 243
9.3.1基本原理 243
9.3.2發(fā)展歷程 244
9.4先進的基于 λ域的碼率控制技術 246
9.4.1 初始 QP選擇 246
9.4.2目標比特分配 247
9.4.3目標比特實現(xiàn) 253
9.4.4參數(shù)更新 254
9.5應用示例 254
9.5.1示例目的 254
9.5.2示例內(nèi)容 254
思考題 257
參考文獻 257
第10章 視頻目標檢測與跟蹤 260
10.1視頻目標檢測 260
10.1.1基本概念 260
10.1.2基本方法原理 261
10.2視頻目標跟蹤 270
10.2.1基本概念 270
10.2.2基本方法原理 272
10.3研究進展及實際應用 286
10.3.1目標檢測前沿技術及其應用 286
10.3.2目標跟蹤前沿技術及其應用 290
思考題 292
參考文獻 292
第11章 多模態(tài)信息處理 295
11.1圖像特征表達 295
11.1.1圖像特征 295
11.1.2基于統(tǒng)計學習的圖像特征提取方法 298
11.1.3基于深度學習的圖像特征提取方法 300
11.2語音特征表達 302
11.2.1語音特征 302
11.2.2基于統(tǒng)計學習的語音特征提取方法 304
11.2.3基于深度學習的語音特征提取方法 307
11.3文本特征表達 308
11.3.1文本特征 308
11.3.2基于深度學習的文本特征提取方法 312
11.4跨模態(tài)檢索 312
11.5多模態(tài)聯(lián)合決策 315
思考題 315
參考文獻 316