本書是英文第4版的中文翻譯,大約有五分之一的內(nèi)容更新。主要更新的內(nèi)容包括:增加了一些新的算法,增加了習題部分,重寫了部分內(nèi)容。更為具體的內(nèi)容更新請參考作者序。本書是在第3版中文翻譯的基礎(chǔ)上,按照直譯的原則進行翻譯的,與英文版形成完全的對照。對于英文版中明顯存在的排印或疏忽類的錯誤,都進行了更正。由于這些錯誤一般都很明顯,因此譯文中沒有專門聲明,讀者如果對照英文版,不難看出其出處。
。1)涵蓋十分廣泛的領(lǐng)域,包括人工智能、信號處理、人工神經(jīng)網(wǎng)絡(luò)、模式識別、機器學習、模糊數(shù)學等一系列相關(guān)學科。
。2)圖將復(fù)雜的概念通過具體示例用易于理解的算法來描述,提供了大量包含圖示和處理結(jié)果的插圖,特別有助于讀者的學習和理解。
。3)提供了豐富的參考文獻,既列出了經(jīng)過時間考驗的經(jīng)典論文,也列出了能反映未來發(fā)展方向的新進展,適于讀者進一步深入探索。
第1章 引言 1
1.1 動機 1
1.2 計算機視覺為什么是困難的 2
1.3 圖像表達與圖像分析的任務(wù) 4
1.4 總結(jié) 7
1.5 習題 7
1.6 參考文獻 8
第2章 圖像及其表達與性質(zhì) 9
2.1 圖像表達若干概念 9
2.2 圖像數(shù)字化 11
2.2.1 采樣 11
2.2.2 量化 12
2.3 數(shù)字圖像性質(zhì) 13
2.3.1 數(shù)字圖像的度量和拓撲性質(zhì) 13
2.3.2 直方圖 17
2.3.3 熵 18
2.3.4 圖像的視覺感知 18
2.3.5 圖像品質(zhì) 20
2.3.6 圖像中的噪聲 21
2.4 彩色圖像 22
2.4.1 色彩物理學 22
2.4.2 人所感知的色彩 23
2.4.3 彩色空間 26
2.4.4 調(diào)色板圖像 28
2.4.5 顏色恒常性 28
2.5 攝像機概述 29
2.5.1 光敏傳感器 29
2.5.2 黑白攝像機 30
2.5.3 彩色攝像機 32
2.6 總結(jié) 32
2.7 習題 33
2.8 參考文獻 35
第3章 圖像及其數(shù)學與物理背景 37
3.1 概述 37
3.1.1 線性 37
3.1.2 狄拉克(Dirac)分布和卷積 37
3.2 積分線性變換 38
3.2.1 作為線性系統(tǒng)的圖像 39
3.2.2 積分線性變換引言 39
3.2.3 1D傅里葉變換 39
3.2.4 2D傅里葉變換 43
3.2.5 采樣與香農(nóng)約束 45
3.2.6 離散余弦變換 47
3.2.7 小波變換 48
3.2.8 本征分析 52
3.2.9 奇異值分解 53
3.2.10 主分量分析 54
3.2.11 Radon變換 56
3.2.12 其他正交圖像變換 56
3.3 作為隨機過程的圖像 57
3.4 圖像形成物理 59
3.4.1 作為輻射測量的圖像 59
3.4.2 圖像獲取與幾何光學 60
3.4.3 鏡頭像差和徑向畸變 63
3.4.4 從輻射學角度看圖像獲取 65
3.4.5 表面反射 67
3.5 總結(jié) 69
3.6 習題 70
3.7 參考文獻 71
第4章 圖像分析的數(shù)據(jù)結(jié)構(gòu) 73
4.1 圖像數(shù)據(jù)表示的層次 73
4.2 傳統(tǒng)圖像數(shù)據(jù)結(jié)構(gòu) 74
4.2.1 矩陣 74
4.2.2 鏈 76
4.2.3 拓撲數(shù)據(jù)結(jié)構(gòu) 76
4.2.4 關(guān)系結(jié)構(gòu) 77
4.3 分層數(shù)據(jù)結(jié)構(gòu) 78
4.3.1 金字塔 78
4.3.2 四叉樹 79
4.3.3 其他金字塔結(jié)構(gòu) 80
4.4 總結(jié) 81
4.5 習題 82
4.6 參考文獻 83
第5章 圖像預(yù)處理 85
5.1 像素亮度變換 85
5.1.1 位置相關(guān)的亮度校正 85
5.1.2 灰度級變換 86
5.2 幾何變換 88
5.2.1 像素坐標變換 88
5.2.2 亮度插值 89
5.3 局部預(yù)處理 91
5.3.1 圖像平滑 91
5.3.2 邊緣檢測算子 97
5.3.3 二階導(dǎo)數(shù)過零點 100
5.3.4 圖像處理中的尺度 104
5.3.5 Canny邊緣提取 105
5.3.6 參數(shù)化邊緣模型 107
5.3.7 多光譜圖像中的邊緣 107
5.3.8 頻域的局部預(yù)處理 108
5.3.9 用局部預(yù)處理算子作線檢測 112
5.3.10 角點(興趣點)檢測 113
5.3.11 最大穩(wěn)定極值區(qū)域檢測 116
5.4 圖像復(fù)原 117
5.4.1 容易復(fù)原的退化 118
5.4.2 逆濾波 118
5.4.3 維納濾波 118
5.5 總結(jié) 120
5.6 習題 121
5.7 參考文獻 126
第6章 分割Ⅰ 130
6.1 閾值化 130
6.1.1 閾值檢測方法 132
6.1.2 最優(yōu)閾值化 133
6.1.3 多光譜閾值化 135
6.2 基于邊緣的分割 136
6.2.1 邊緣圖像閾值化 137
6.2.2 邊緣松弛法 138
6.2.3 邊界跟蹤 139
6.2.4 作為圖搜索的邊緣跟蹤 143
6.2.5 作為動態(tài)規(guī)劃的邊緣跟蹤 149
6.2.6 Hough變換 152
6.2.7 使用邊界位置信息的邊界
???檢測 157
6.2.8 從邊界構(gòu)造區(qū)域 157
6.3 基于區(qū)域的分割 159
6.3.1 區(qū)域歸并 160
6.3.2 區(qū)域分裂 161
6.3.3 分裂與歸并 162
6.3.4 分水嶺分割 165
6.3.5 區(qū)域增長后處理 167
6.4 匹配 167
6.4.1 模版匹配 168
6.4.2 模版匹配的控制策略 170
6.5 分割的評測問題 170
6.5.1 監(jiān)督式評測 171
6.5.2 非監(jiān)督式評測 173
6.6 總結(jié) 174
6.7 習題 176
6.8 參考文獻 178
第7章 分割Ⅱ 185
7.1 均值移位分割 185
7.2 活動輪廓模型——蛇行 190
7.2.1 經(jīng)典蛇行和氣球 191
7.2.2 擴展 193
7.2.3 梯度矢量流蛇 194
7.3 幾何變形模型——水平集和測地
?? 活動輪廓 198
7.4 模糊連接性 203
7.5 面向基于3D圖的圖像分割 208
7.5.1 邊界對的同時檢測 208
7.5.2 次優(yōu)的表面檢測 211
7.6 圖割分割 212
7.7 最優(yōu)單和多表面分割 217
7.8 總結(jié) 227
7.9 習題 228
7.10 參考文獻 229
第8章 形狀表示與描述 237
8.1 區(qū)域標識 239
8.2 基于輪廓的形狀表示與描述 241
8.2.1 鏈碼 241
8.2.2 簡單幾何邊界表示 242
8.2.3 邊界的傅里葉變換 245
8.2.4 使用片段序列的邊界描述 246
8.2.5 B樣條表示 249
8.2.6 其他基于輪廓的形狀描述
???方法 250
8.2.7 形狀不變量 251
8.3 基于區(qū)域的形狀表示與描述 253
8.3.1 簡單的標量區(qū)域描述 254
8.3.2 矩 257
8.3.3 凸包 259
8.3.4 基于區(qū)域骨架的圖表示 262
8.3.5 區(qū)域分解 266
8.3.6 區(qū)域鄰近圖 267
8.4 形狀類別 268
8.5 總結(jié) 268
8.6 習題 270
8.7 參考文獻 272
第9章 物體識別 278
9.1 知識表示 278
9.2 統(tǒng)計模式識別 281
9.2.1 分類原理 282
9.2.2 最近鄰 283
9.2.3 分類器設(shè)置 285
9.2.4 分類器學習 287
9.2.5 支持向量機 288
9.2.6 聚類分析 291
9.3 神經(jīng)元網(wǎng)絡(luò) 293
9.3.1 前饋網(wǎng)絡(luò) 294
9.3.2 非監(jiān)督學習 295
9.3.3 Hopfield神經(jīng)元網(wǎng)絡(luò) 296
9.4 句法模式識別 297
9.4.1 語法與語言 298
9.4.2 句法分析與句法分類器 300
9.4.3 句法分類器學習與語法推導(dǎo) 301
9.5 作為圖匹配的識別 302
9.5.1 圖和子圖的同構(gòu) 303
9.5.2 圖的相似度 305
9.6 識別中的優(yōu)化技術(shù) 306
9.6.1 遺傳算法 307
9.6.2 模擬退火 308
9.7 模糊系統(tǒng) 309
9.7.1 模糊集和模糊隸屬函數(shù) 310
9.7.2 模糊集運算 311
9.7.3 模糊推理 312
9.7.4 模糊系統(tǒng)設(shè)計與訓(xùn)練 314
9.8 模式識別中的Boosting方法 315
9.9 隨機森林 317
9.9.1 隨機森林訓(xùn)練 318
9.9.2 隨機森林決策 321
9.9.3 隨機森林擴展 322
9.10 總結(jié) 322
9.11 習題 325
9.12 參考文獻 330
第10章 圖像理解 335
10.1 圖像理解控制策略 336
10.1.1 并行和串行處理控制 336
10.1.2 分層控制 337
10.1.3 自底向上的控制 337
10.1.4 基于模型的控制 337
10.1.5 混合的控制策略 338
10.1.6 非分層控制 341
10.2 SIFT:尺度不變特征轉(zhuǎn)換 342
10.3 RANSAC:通過隨機抽樣一致來
???擬合 344
10.4 點分布模型 347
10.5 活動表觀模型 355
10.6 圖像理解中的模式識別方法 362
10.6.1 基于分類的分割 362
10.6.2 上下文圖像分類 364
10.6.3 梯度方向直方圖-HOG 367
10.7 Boosted層疊分類器用于快速物體
???檢測 370
10.8 基于隨機森林的圖像理解 372
10.9 場景標注和約束傳播 377
10.9.1 離散松弛法 378
10.9.2 概率松弛法 379
10.9.3 搜索解釋樹 381
10.10 語義圖像分割和理解 382
10.10.1 語義區(qū)域增長 383
10.10.2 遺傳圖像解釋 384
10.11 隱馬爾可夫模型 390
10.11.1 應(yīng)用 394
10.11.2 耦合的HMM 394
10.11.3 貝葉斯信念網(wǎng)絡(luò) 395
10.12 馬爾科夫隨機場 397
?10.12.1 圖像和視覺的應(yīng)用 398
10.13 高斯混合模型和期望最大化 399
10.14 總結(jié) 404
10.15 習題 407
10.16 參考文獻 410
第11章 3D幾何,對應(yīng),從亮度到3D 419
11.1 3D視覺任務(wù) 419
11.1.1 Marr理論 421
11.1.2 其他視覺范疇:主動和
有目的的視覺 422
11.2 射影幾何學基礎(chǔ) 423
11.2.1 射影空間中的點和超平面 424
11.2.2 單應(yīng)性 426
11.2.3 根據(jù)對應(yīng)點估計單應(yīng)性 427
11.3 單透視攝像機 430
11.3.1 攝像機模型 430
11.3.2 齊次坐標系中的投影和
反投影 432
11.3.3 從已知場景標定一個
攝像機 432
11.4 從多視圖重建場景 433
11.4.1 三角測量 433
11.4.2 射影重建 434
11.4.3 匹配約束 435
11.4.4 光束平差法 436
11.4.5 升級射影重建和自標定 437
11.5 雙攝像機和立體感知 438
11.5.1 極線幾何學——基本矩陣 438
11.5.2 攝像機的相對運動——本質(zhì)
矩陣 440
11.5.3 分解基本矩陣到攝像機
矩陣 441
11.5.4 從對應(yīng)點估計基本矩陣 441
11.5.5 雙攝像機矯正結(jié)構(gòu) 442
11.5.6 矯正計算 444
11.6 三攝像機和三視張量 445
11.6.1 立體對應(yīng)點算法 446
11.6.2 距離圖像的主動獲取 451
11.7 由輻射測量到3D信息 453
11.7.1 由陰影到形狀 453
11.7.2 光度測量立體視覺 455
11.8 總結(jié) 456
11.9 習題 457
11.10 參考文獻 459
第12章 3D視覺的應(yīng)用 464
12.1 由X到形狀 464
12.1.1 由運動到形狀 464
12.1.2 由紋理到形狀 468
12.1.3 其他由X到形狀的技術(shù) 469
12.2 完全的3D物體 471
12.2.1 3D物體、模型以及相關(guān)
問題 471
12.2.2 線條標注 472
12.2.3 體積表示和直接測量 474