本書主要內(nèi)容圍繞2D計算機視覺展開,介紹了相關(guān)的基礎(chǔ)概念、基本原理、典型算法、實用技術(shù)和應(yīng)用成果。本書可在其姊妹篇《3D計算機視覺:原理、算法及應(yīng)用》前學(xué)習(xí)。 本書將從客觀場景出發(fā)到最后提取出目標(biāo)信息的全過程分為4 個部分進行介紹。第1 部分是圖像采集,介紹了基礎(chǔ)的圖像采集表達技術(shù);第2 部分是圖像(預(yù))處理,介紹了一些基本的圖像處理技術(shù);第3 部分是目標(biāo)提取,介紹了從圖像處理到圖像分析的轉(zhuǎn)換技術(shù);第4 部分是目標(biāo)分析,介紹了擴展的圖像分析技術(shù)。書中除提供大量應(yīng)用示例外,還針對每章的內(nèi)容提供了自我檢測題(含提示并附有答案),并且給出了相關(guān)的參考文獻和術(shù)語索引(包括英文)。
章毓晉,于1989年獲比利時列日大學(xué)應(yīng)用科學(xué)博士學(xué)位。1989—1993年,先后在荷蘭德爾夫特大學(xué)從事博士后研究工作并擔(dān)任專職研究員。于1993年到清華大學(xué)任教,1997年被聘為教授,1998年被聘為博士生導(dǎo)師,2014年成為教學(xué)科研系列長聘教授。在2003年學(xué)術(shù)休假期間,同時被聘為新加坡南洋理工大學(xué)訪問教授。在清華大學(xué),先后開出并講授10多門本科生和研究生課程。在南洋理工大學(xué),開出并講授研究生課程“現(xiàn)代圖像分析(英語)”。已編寫出版了圖像工程系列教材第1版、第2版、第3版和第4版,《圖像工程問題解析》、《圖像處理和分析基礎(chǔ)》、《圖像處理和分析技術(shù)》(第2版和第3版)、《圖像處理和分析教程》(第1版、第2版和第3版)、《計算機視覺教程》(第1版、第2版和第3版)和《圖像處理基礎(chǔ)教程》,以及Image Engineering: Processing, Analysis, and Understanding,Image Engineering, Vol.1, Image Processing,Image Engineering, Vol.2, Image Analysis,Image Engineering, Vol.3, Image Understanding,翻譯出版了《彩色數(shù)字圖像處理》、《圖像處理基礎(chǔ)》(第2版)、《MATLAB圖像和視頻處理》、《計算機視覺基礎(chǔ)》和《彩色計算機視覺》,研制出版了《“圖像處理和分析’’多媒體計算機輔助教學(xué)課件》和《圖像處理和分析網(wǎng)絡(luò)課程》。已在國內(nèi)外發(fā)表了30多篇教學(xué)研究論文。主要科學(xué)研究領(lǐng)域為所提出的圖像工程(圖像處理、圖像分析、圖像理解及其技術(shù)應(yīng)用)。自1996年起,已連續(xù)26年對中國圖像工程的研究及主要文獻進行了系統(tǒng)的年度分類和總結(jié)綜述。已在國內(nèi)外發(fā)表了500多篇圖像工程研究論文,出版了專著《圖象分割》《基于內(nèi)容的視覺信息檢索》《基于子空間的人臉識別》,編著了《英漢圖像工程辭典》(第1版、第2版和第3版)、《圖像工程技術(shù)選編》和《圖像工程技術(shù)選編(二)》,主持編著了Advances in Image and Video Segmentation,Semantic-Based Visual Information Retrieval,Advances in Face Image Analysis: Techniques and Technologies,出版了Handbook of Image Engineering和A Selection of Image Processing Techniques.曾任第24屆國際圖像處理學(xué)術(shù)會議(ICIP‘2017)等20多個國內(nèi)外學(xué)術(shù)會議的程序委員會主席,F(xiàn)為中國圖象圖形學(xué)學(xué)會名譽監(jiān)事長和會士、國際電氣電子工程師協(xié)會(IEEE)高級會員、國際光學(xué)工程協(xié)會(SPIE)會士(因在圖像工程方面的成就)。
第1章 計算機視覺基礎(chǔ) 1
1.1 視覺基礎(chǔ) 1
1.1.1 視覺 1
1.1.2 視感覺和視知覺 2
1.1.3 視覺過程 3
1.2 視覺和圖像 5
1.2.1 圖像和數(shù)字圖像 6
1.2.2 圖像和像素表示 7
1.2.3 圖像存儲與文件格式 8
1.2.4 圖像顯示和打印方法 12
1.3 視覺系統(tǒng)和圖像技術(shù) 14
1.3.1 視覺系統(tǒng)流程 15
1.3.2 圖像技術(shù)層次 15
1.3.3 圖像技術(shù)類別 16
1.4 本書架構(gòu)和內(nèi)容概況 17
1.4.1 結(jié)構(gòu)框架和主要內(nèi)容 17
1.4.2 各章概況 18
1.4.3 先修基礎(chǔ) 19
1.5 各節(jié)要點和進一步參考 20
第2章 2D圖像采集 22
2.1 采集裝置和性能指標(biāo) 23
2.1.1 CCD傳感器 23
2.1.2 CMOS傳感器 24
2.1.3 常用性能指標(biāo) 25
2.1.4 圖像采集流程 25
2.2 圖像亮度成像模型 26
2.2.1 光度學(xué)基礎(chǔ) 26
2.2.2 均勻照度 27
2.2.3 簡單亮度成像模型 29
2.3 圖像空間成像模型 30
2.3.1 投影成像幾何 30
2.3.2 基本成像模型 32
2.3.3 一般成像模型 34
2.4 采樣和量化 37
2.4.1 空間和幅度分辨率 37
2.4.2 圖像數(shù)據(jù)量與質(zhì)量 39
2.5 像素之間的關(guān)系 43
2.5.1 像素鄰域及連通 43
2.5.2 像素間距離 44
2.6 各節(jié)要點和進一步參考 46
第3章 空域增強 47
3.1 圖像間運算 47
3.1.1 算術(shù)運算 48
3.1.2 邏輯運算 50
3.2 圖像灰度映射 51
3.2.1 圖像求反 51
3.2.2 對比度拉伸 52
3.2.3 動態(tài)范圍壓縮 53
3.3 直方圖均衡化 53
3.3.1 圖像直方圖 53
3.3.2 原理和步驟 55
3.4 直方圖規(guī)定化 57
3.4.1 原理和步驟 57
3.4.2 單映射規(guī)則和組映射規(guī)則 59
3.5 空域卷積增強 62
3.5.1 模板卷積 62
3.5.2 空域濾波 63
3.6 各節(jié)要點和進一步參考 67
第4章 頻域增強 69
4.1 傅里葉變換和頻域增強 70
4.1.1 傅里葉變換 70
4.1.2 傅里葉變換特性 71
4.1.3 頻域增強 72
4.2 頻域低通濾波器 73
4.2.1 理想低通濾波器 73
4.2.2 巴特沃斯低通濾波器 74
4.3 頻域高通濾波器 75
4.3.1 理想高通濾波器 76
4.3.2 巴特沃斯高通濾波器 76
4.4 帶通帶阻濾波器 77
4.4.1 帶通濾波器 78
4.4.2 帶阻濾波器 79
4.4.3 帶通濾波器和帶阻濾波器的聯(lián)系 80
4.4.4 陷波濾波器 81
4.4.5 交互消除周期噪聲 82
4.5 同態(tài)濾波器 84
4.5.1 同態(tài)濾波流程 84
4.5.2 同態(tài)濾波消噪 86
4.6 各節(jié)要點和進一步參考 86
第5章 圖像恢復(fù) 88
5.1 圖像退化模型 88
5.1.1 圖像退化模型 89
5.1.2 圖像退化模型性質(zhì) 90
5.2 逆濾波 91
5.2.1 無約束恢復(fù) 91
5.2.2 逆濾波模型 92
5.3 維納濾波 93
5.3.1 有約束恢復(fù) 93
5.3.2 維納濾波器 94
5.4 幾何失真校正 95
5.4.1 空間變換 95
5.4.2 灰度插值 97
5.5 圖像修補 99
5.5.1 圖像修補原理 99
5.5.2 圖像修補示例 100
5.6 各節(jié)要點和進一步參考 103
第6章 彩色增強 105
6.1 彩色視覺 105
6.1.1 三基色和顏色表示 106
6.1.2 色度圖 107
6.2 彩色模型 109
6.2.1 RGB模型 109
6.2.2 HSI模型 110
6.2.3 從RGB轉(zhuǎn)換到HSI 111
6.2.4 從HSI轉(zhuǎn)換到RGB 111
6.3 偽彩色增強 113
6.3.1 亮度切割 113
6.3.2 從灰度到彩色的變換 114
6.3.3 頻域濾波 115
6.4 真彩色增強 115
6.4.1 單分量真彩色增強 116
6.4.2 全彩色增強 118
6.5 各節(jié)要點和進一步參考 119
第7章 圖像分割 121
7.1 定義和算法分類 122
7.1.1 圖像分割定義 122
7.1.2 圖像分割算法分類 123
7.2 微分邊緣檢測 124
7.2.1 微分邊緣檢測原理 124
7.2.2 空域微分算子 125
7.3 主動輪廓模型 129
7.3.1 主動輪廓 129
7.3.2 能量函數(shù) 130
7.4 閾值化分割 134
7.4.1 原理步驟 134
7.4.2 閾值選取 135
7.5 基于過渡區(qū)選取閾值 138
7.5.1 過渡區(qū)和有效平均梯度 138
7.5.2 有效平均梯度的極值點和過渡區(qū)邊界 139
7.5.3 閾值選取 140
7.6 區(qū)域生長 141
7.6.1 基本方法 141
7.6.2 問題和改進 143
7.7 各節(jié)要點和進一步參考 144
第8章 基元檢測 146
8.1 興趣點檢測 146
8.1.1 利用二階導(dǎo)數(shù)檢測角點 147
8.1.2 哈里斯興趣點算子 148
8.1.3 積分角點檢測 150
8.2 橢圓目標(biāo)檢測 155
8.2.1 直徑二分法 155
8.2.2 弦?切線法 156
8.2.3 橢圓的其他參數(shù) 156
8.3 哈夫變換 158
8.3.1 點?線對偶性 158
8.3.2 計算步驟 159
8.3.3 極坐標(biāo)方程 162
8.4 廣義哈夫變換 164
8.4.1 推廣原理 164
8.4.2 完整廣義哈夫變換 166
8.5 各節(jié)要點和進一步參考 168
第9章 目標(biāo)表達 170
9.1 輪廓的鏈碼表達 170
9.1.1 鏈碼表達 171
9.1.2 鏈碼歸一化 172
9.2 輪廓標(biāo)志 173
9.2.1 距離?角度標(biāo)志 173
9.2.2 切線角?弧長標(biāo)志 174
9.2.3 斜率?密度標(biāo)志 174
9.2.4 距離?弧長標(biāo)志 175
9.3 輪廓的多邊形近似 175
9.3.1 最小周長多邊形 176
9.3.2 聚合多邊形 176
9.3.3 分裂多邊形 177
9.4 目標(biāo)的層次表達 178
9.4.1 四叉樹表達法 178
9.4.2 二叉樹表達法 180
9.5 目標(biāo)的圍繞區(qū)域 180
9.5.1 外接盒 181
9.5.2 最小包圍長方形 182
9.5.3 凸包 182
9.6 目標(biāo)的骨架表達 183
9.6.1 骨架和骨架點 183
9.6.2 骨架算法 184
9.7 各節(jié)要點和進一步參考 186
第10章 目標(biāo)描述 188
10.1 輪廓基本描述參數(shù) 189
10.1.1 輪廓長度 189
10.1.2 輪廓直徑 190
10.1.3 斜率、曲率和角點 190
10.2 區(qū)域基本描述參數(shù) 191
10.2.1 區(qū)域面積 191
10.2.2 區(qū)域重心 192
10.2.3 區(qū)域灰度特性 192
10.3 輪廓的傅里葉描述 193
10.3.1 傅里葉輪廓描述符 193
10.3.2 傅里葉描述隨輪廓的變化 195
10.4 輪廓的小波描述 196
10.4.1 小波變換基礎(chǔ) 196
10.4.2 小波輪廓描述符 197
10.5 區(qū)域不變矩描述 199
10.5.1 中心矩 200
10.5.2 區(qū)域不變矩 201
10.5.3 區(qū)域仿射不變矩 202
10.6 目標(biāo)關(guān)系描述 203
10.6.1 字符串描述 203
10.6.2 樹結(jié)構(gòu)描述 205
10.7 各節(jié)要點和進一步參考 206
第11章 紋理描述 208
11.1 紋理的統(tǒng)計描述 208
11.1.1 共生矩陣 208
11.1.2 基于共生矩陣的紋理描述符 210
11.1.3 基于能量的紋理描述符 212
11.2 紋理的結(jié)構(gòu)描述 213
11.2.1 結(jié)構(gòu)法基礎(chǔ) 213
11.2.2 紋理鑲嵌 215
11.2.3 局部二值模式 216
11.3 紋理的頻譜描述 218
11.3.1 傅里葉頻譜 218
11.3.2 貝塞爾?傅里葉頻譜 220
11.4 各節(jié)要點和進一步參考 222
第12章 形狀描述 223
12.1 形狀緊湊性描述符 223
12.1.1 外觀比 224
12.1.2 形狀因子 224
12.1.3 偏心率 225
12.1.4 球狀性 227
12.1.5 圓形性 228
12.1.6 描述符比較 228
12.2 形狀復(fù)雜性描述符 229
12.2.1 形狀復(fù)雜性的簡單描述符 230
12.2.2 利用模糊圖的直方圖分析描述形狀復(fù)雜度 230
12.2.3 飽和度 231
12.3 基于離散曲率的描述符 232
12.3.1 曲率與幾何特征 232
12.3.2 離散曲率 233
12.3.3 離散曲率的計算 234
12.3.4 基于曲率的描述符 235
12.4 拓撲結(jié)構(gòu)描述符 237
12.4.1 歐拉數(shù) 237
12.4.2 交叉數(shù)和連接數(shù) 238
12.5 各節(jié)要點和進一步參考 239
第13章 目標(biāo)分類 241
13.1 不變量交叉比 241
13.1.1 交叉比 241
13.1.2 非共線點的不變量 244
13.1.3 對稱的交叉比函數(shù) 245
13.1.4 交叉比應(yīng)用示例 246
13.2 統(tǒng)計模式分類 247
13.2.1 模式分類原理 248
13.2.2 最小距離分類器 248
13.2.3 最優(yōu)統(tǒng)計分類器 250
13.2.4 自適應(yīng)自舉 254
13.3 支持向量機 256
13.3.1 線性可分類 256
13.3.2 線性不可分類 258
13.4 各節(jié)要點和進一步參考 260
附錄A 二值數(shù)學(xué)形態(tài)學(xué) 262
A.1 基本集合定義 262
A.2 二值數(shù)學(xué)形態(tài)學(xué)基本運算 264
A.2.1 二值膨脹和腐蝕 264
A.2.2 二值開啟和閉合 268
A.3 二值數(shù)學(xué)形態(tài)學(xué)組合運算 270
A.3.1 擊中?擊不中變換 270
A.3.2 二值組合運算 272
A.4 二值數(shù)學(xué)形態(tài)學(xué)實用算法 277
A.4.1 噪聲濾除 277
A.4.2 角點檢測 278
A.4.3 輪廓提取 279
A.4.4 區(qū)域填充 279
A.4.5 目標(biāo)檢測和定位 280
A.4.6 連通組元抽取 280
A.4.7 區(qū)域骨架提取 281
A.5 各節(jié)要點和進一步參考 284
附錄B 視覺恒常性 285
B.1 視覺恒常性理論 285
B.1.1 各種恒常性 285
B.1.2 視網(wǎng)膜皮層理論 287
B.2 圖像增強應(yīng)用 288
B.2.1 霧天圖像增強 289
B.2.2 紅外圖像增強 290
B.3 各節(jié)要點和進一步參考 291
自我檢測題 292
自我檢測題答案 349
參考文獻 362
術(shù)語索引 371