圖像畫(huà)質(zhì)算法與底層視覺(jué)技術(shù)
定 價(jià):139 元
- 作者:賈壯
- 出版時(shí)間:2024/7/1
- ISBN:9787121478765
- 出 版 社:電子工業(yè)出版社
- 中圖法分類(lèi):TN911.73
- 頁(yè)碼:404
- 紙張:
- 版次:01
- 開(kāi)本:16開(kāi)
本書(shū)主要介紹了圖像畫(huà)質(zhì)相關(guān)的各類(lèi)底層視覺(jué)任務(wù)及其相關(guān)算法,重點(diǎn)講解了去噪、超分辨率、去霧、高動(dòng)態(tài)范圍、圖像合成與圖像和諧化、圖像增強(qiáng)與圖像修飾等多種類(lèi)型的基礎(chǔ)任務(wù)的設(shè)定及其對(duì)應(yīng)的經(jīng)典算法和模型。本書(shū)討論了底層視覺(jué)任務(wù)的基本特征,并從成像過(guò)程及圖像處理的基礎(chǔ)知識(shí)出發(fā),系統(tǒng)分析了不同任務(wù)下的退化機(jī)制,以及對(duì)應(yīng)的算法設(shè)計(jì)原則。本書(shū)在算法選擇上兼顧了經(jīng)典的傳統(tǒng)圖像算法及當(dāng)前較新的人工智能模型算法,可以作為從圖像處理領(lǐng)域或者深度學(xué)習(xí)領(lǐng)域進(jìn)入底層計(jì)算機(jī)視覺(jué)領(lǐng)域進(jìn)行學(xué)習(xí)的讀者的基礎(chǔ)讀物。本書(shū)主要面向的讀者群體包括深度學(xué)習(xí)與計(jì)算機(jī)視覺(jué)行業(yè)的從業(yè)人員,計(jì)算機(jī)、人工智能及其相關(guān)專(zhuān)業(yè)方向的學(xué)生,圖像處理相關(guān)技術(shù)的愛(ài)好者與學(xué)習(xí)者。
賈壯,計(jì)算機(jī)視覺(jué)算法工程師,畢業(yè)于清華大學(xué)自動(dòng)化系,模式識(shí)別與智能系統(tǒng)方向碩士,曾在百度、華為等單位從事多項(xiàng)視覺(jué)相關(guān)算法項(xiàng)目的研發(fā)與交付,在相關(guān)期刊和會(huì)議發(fā)表多篇論文,并在視覺(jué)相關(guān)國(guó)際競(jìng)賽中獲得獎(jiǎng)項(xiàng),編著有《機(jī)器學(xué)習(xí)與深度學(xué)習(xí)算法基礎(chǔ)》等技術(shù)書(shū)籍。
第1章 畫(huà)質(zhì)算法與底層視覺(jué)概述 1
1.1 畫(huà)質(zhì)算法的主要任務(wù) 1
1.1.1 畫(huà)質(zhì)算法定義及其主要類(lèi)別 1
1.1.2 畫(huà)質(zhì)問(wèn)題的核心:退化 3
1.2 基于深度學(xué)習(xí)的底層視覺(jué)技術(shù) 4
1.2.1 深度學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò) 4
1.2.2 底層視覺(jué)任務(wù)的特點(diǎn) 5
第2章 畫(huà)質(zhì)處理的基礎(chǔ)知識(shí) 7
2.1 光照與成像 7
2.1.1 視覺(jué)與光學(xué)成像 7
2.1.2 Bayer陣列與去馬賽克 15
2.1.3 相機(jī)圖像信號(hào)處理的基本流程 20
2.2 色彩與顏色空間 25
2.2.1 人眼色覺(jué)與色度圖 25
2.2.2 常見(jiàn)的顏色空間 28
2.3 圖像的影調(diào)調(diào)整方法 32
2.3.1 直方圖與對(duì)比度 32
2.3.2 對(duì)比度拉伸與直方圖均衡 35
2.3.3 對(duì)比度增強(qiáng)算法的改進(jìn)策略 39
2.4 圖像常見(jiàn)的空間操作 42
2.4.1 基本圖像變換:仿射變換與透視變換 42
2.4.2 光流與幀間對(duì)齊 50
2.5 圖像的頻域分析與圖像金字塔 54
2.5.1 傅里葉變換與頻域分析 54
2.5.2 自然圖像的頻域統(tǒng)計(jì)特性 60
2.5.3 圖像金字塔:高斯金字塔與拉普拉斯金字塔 61
第3章 圖像與視頻去噪算法 66
3.1 噪聲的來(lái)源與數(shù)學(xué)模型 66
3.1.1 圖像噪聲的物理來(lái)源 66
3.1.2 噪聲的數(shù)學(xué)模型 68
3.2 去噪算法的難點(diǎn)與策略 76
3.2.1 去噪算法的難點(diǎn) 76
3.2.2 盲去噪與非盲去噪 77
3.2.3 高斯去噪與真實(shí)噪聲去噪 77
3.2.4 去噪算法的評(píng)價(jià)指標(biāo) 78
3.3 傳統(tǒng)去噪算法 84
3.3.1 空域?yàn)V波:均值、高斯與中值濾波器 84
3.3.2 非局部均值算法 87
3.3.3 小波變換去噪算法 90
3.3.4 雙邊濾波與導(dǎo)向?yàn)V波 96
3.3.5 BM3D濾波算法 104
3.4 深度學(xué)習(xí)去噪算法 106
3.4.1 深度殘差去噪網(wǎng)絡(luò)DnCNN和FFDNet 106
3.4.2 噪聲估計(jì)網(wǎng)絡(luò)去噪:CBDNet 115
3.4.3 小波變換與神經(jīng)網(wǎng)絡(luò)的結(jié)合:MWCNN 119
3.4.4 視頻去噪:DVDNet和FastDVDNet 125
3.4.5 基于Transformer的去噪方法:IPT與SwinIR 132
3.4.6 自監(jiān)督去噪算法:Noise2Noise、Noise2Void與DIP 138
3.4.7 Raw域去噪策略與算法:Unprocess與CycleISP 142
第4章 圖像與視頻超分辨率 145
4.1 超分辨率任務(wù)概述 146
4.1.1 分辨率與超分辨率任務(wù) 146
4.1.2 超分辨率的任務(wù)設(shè)定與特點(diǎn) 147
4.1.3 超分辨率的評(píng)價(jià)指標(biāo) 150
4.2 超分辨率的傳統(tǒng)算法 156
4.2.1 上采樣插值算法與圖像銳化處理 156
4.2.2 基于自相似性的超分辨率 162
4.2.3 基于稀疏編碼的超分辨率 164
4.3 經(jīng)典深度學(xué)習(xí)超分辨率算法 166
4.3.1 神經(jīng)網(wǎng)絡(luò)超分辨率開(kāi)端:SRCNN和FSRCNN 167
4.3.2 無(wú)參的高效上采樣:ESPCN 171
4.3.3 無(wú)BN層的殘差網(wǎng)絡(luò):EDSR 173
4.3.4 殘差稠密網(wǎng)絡(luò) 176
4.3.5 針對(duì)視覺(jué)畫(huà)質(zhì)的優(yōu)化:SRGAN與ESRGAN 178
4.3.6 注意力機(jī)制超分辨率網(wǎng)絡(luò):RCAN 183
4.3.7 盲超分辨率中的退化估計(jì):ZSSR與KernelGAN 187
4.4 真實(shí)世界的超分辨率模型 189
4.4.1 復(fù)雜退化模擬:BSRGAN與Real-ESRGAN 189
4.4.2 圖像域遷移:CycleGAN類(lèi)網(wǎng)絡(luò)與無(wú)監(jiān)督超分辨率 193
4.4.3 擴(kuò)散模型的真實(shí)世界超分辨率:StableSR 196
4.5 超分辨率模型的輕量化 199
4.5.1 多分支信息蒸餾:IMDN與RFDN 199
4.5.2 重參數(shù)化策略:ECBSR 206
4.5.3 消除特征冗余:GhostSR 214
4.5.4 單層極輕量化模型:edgeSR 217
4.6 視頻超分辨率模型簡(jiǎn)介 221
4.6.1 視頻超分辨率的特點(diǎn) 221
4.6.2 BasicVSR、BasicVSR++與RealBasicVSR 223
4.7 超分辨率模型的優(yōu)化策略 227
4.7.1 基于分頻分區(qū)域處理的模型設(shè)計(jì) 227
4.7.2 針對(duì)細(xì)節(jié)紋理的恢復(fù)策略 228
4.7.3 可控可解釋的畫(huà)質(zhì)恢復(fù)與超分辨率 231
第5章 圖像去霧 235
5.1 圖像去霧任務(wù)概述 235
5.1.1 有霧圖像的形成與影響 235
5.1.2 有霧圖像的退化:大氣散射模型 236
5.1.3 去霧算法的主要思路 237
5.2 基于物理模型的去霧算法 238
5.2.1 基于反照系數(shù)分解的Fattal去霧算法 238
5.2.2 暗通道先驗(yàn)去霧算法 243
5.2.3 顏色衰減先驗(yàn)去霧算法 248
5.3 深度學(xué)習(xí)去霧算法 255
5.3.1 端到端的透射圖估計(jì):DehazeNet 255
5.3.2 輕量級(jí)去霧網(wǎng)絡(luò)模型:AOD-Net 260
5.3.3 基于GAN的去霧模型:Dehaze cGAN和Cycle-Dehaze 262
5.3.4 金字塔稠密連接網(wǎng)絡(luò):DCPDN 264
5.3.5 特征融合注意力去霧模型:FFA-Net 265
第6章 圖像高動(dòng)態(tài)范圍 277
6.1 圖像HDR任務(wù)簡(jiǎn)介 277
6.1.1 動(dòng)態(tài)范圍的概念 277
6.1.2 HDR任務(wù)分類(lèi)與關(guān)鍵問(wèn)題 279
6.2 傳統(tǒng)HDR相關(guān)算法 280
6.2.1 多曝融合算法 280
6.2.2 局部拉普拉斯濾波算法 285
6.2.3 Reinhard攝影色調(diào)重建算法 295
6.2.4 快速雙邊濾波色調(diào)映射算法 301
6.3 基于神經(jīng)網(wǎng)絡(luò)模型的HDR算法 306
6.3.1 網(wǎng)絡(luò)模型的訓(xùn)練目標(biāo):MEF-SSIM 306
6.3.2 端到端多曝融合算法:DeepFuse 310
6.3.3 多曝權(quán)重的網(wǎng)絡(luò)計(jì)算:MEF-Net 313
6.3.4 注意力機(jī)制HDR網(wǎng)絡(luò):AHDRNet 317
6.3.5 單圖動(dòng)態(tài)范圍擴(kuò)展:ExpandNet 327
第7章 圖像合成與圖像和諧化 331
7.1 圖像合成任務(wù)簡(jiǎn)介 331
7.2 經(jīng)典圖像合成算法 332
7.2.1 alpha通道混合算法 332
7.2.2 多尺度融合:拉普拉斯金字塔融合 334
7.2.3 梯度域的無(wú)縫融合:泊松融合 337
7.3 深度學(xué)習(xí)圖像合成與圖像和諧化 343
7.3.1 空間分離注意力:S2AM模型 344
7.3.2 域驗(yàn)證的和諧化:DoveNet 348
7.3.3 背景引導(dǎo)的域轉(zhuǎn)換:BargainNet 354
7.3.4 前景到背景的風(fēng)格遷移:RainNet 357
第8章 圖像增強(qiáng)與圖像修飾 360
8.1 圖像增強(qiáng)任務(wù)概述 360
8.2 傳統(tǒng)低光增強(qiáng)算法 361
8.2.1 基于反色去霧的低光增強(qiáng)算法 361
8.2.2 多尺度Retinex算法 364
8.3 神經(jīng)網(wǎng)絡(luò)模型的增強(qiáng)與顏色調(diào)整 369
8.3.1 Retinex理論的模型實(shí)現(xiàn):RetinexNet 370
8.3.2 雙邊實(shí)時(shí)增強(qiáng)算法:HDRNet 374
8.3.3 無(wú)參考圖的低光增強(qiáng):Zero-DCE 376
8.3.4 可控的修圖模型:CSRNet 380
8.3.5 3D LUT類(lèi)模型:圖像自適應(yīng)3D LUT和NILUT 383
8.3.6 色域擴(kuò)展:GamutNet和GamutMLP 388