本書較全面地介紹了數(shù)字圖像處理的基礎(chǔ)理論、經(jīng)典算法及典型應(yīng)用。本書內(nèi)容包括數(shù)字圖像處理基礎(chǔ)知識(shí)、圖像增強(qiáng)、圖像復(fù)原、圖像的幾何變換與幾何校正、形態(tài)學(xué)圖像處理、圖像分割、圖像描述與特征提取等,并通過(guò)一個(gè)較完整的車牌識(shí)別系統(tǒng)向讀者詳細(xì)介紹了數(shù)字圖像處理系統(tǒng)的基本設(shè)計(jì)思想與設(shè)計(jì)方法。本書實(shí)踐部分介紹了OpenCV、NumPy、Matplotlib、Scikit-learn等圖像處理相關(guān)工具包的常用方法,其中的代碼匯集生成了“基于Python的圖像處理算法演示系統(tǒng)v1.0”,以輔助讀者理解算法。為適應(yīng)人工智能等新技術(shù)的發(fā)展,本書簡(jiǎn)單介紹了卷積神經(jīng)網(wǎng)絡(luò)的平移、旋轉(zhuǎn)、尺度縮放、形變等不變性,讓讀者理解卷積神經(jīng)網(wǎng)絡(luò)在圖像處理方面的優(yōu)勢(shì)。
本書編者在編寫過(guò)程中,收集整理了大量經(jīng)典的圖像處理算法,引入了新的圖像處理技術(shù),全書的例題在Python環(huán)境下均通過(guò)了調(diào)試。本書可作為普通高校電子信息、人工智能、計(jì)算機(jī)等專業(yè)的教材,也適合各類培訓(xùn)班作為教材使用。
本書配有以下教學(xué)資源:電子課件,習(xí)題答案,示例代碼和對(duì)應(yīng)的素材,圖像處理算法演示系統(tǒng)。歡迎選用本書作教材的教師發(fā)郵件到j(luò)inacmp@163.com或登錄www.cmpedu.com 注冊(cè)下載。
俗話說(shuō)“眼見為實(shí)”“百聞不如一見”,圖像已成為人類獲取和交換信息的主要來(lái)源。數(shù)字圖像具有信息量大、占用的頻帶較寬且像素間的相關(guān)性強(qiáng)等特點(diǎn),數(shù)字圖像處理需要綜合應(yīng)用信息處理、計(jì)算機(jī)、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)分析等各方面的知識(shí)和技術(shù),對(duì)已有的圖像進(jìn)行變換、處理、重構(gòu),從而改進(jìn)圖像質(zhì)量或從圖像中提取有用的信息。
目前普通高等院校人工智能、計(jì)算機(jī)、電子信息等相關(guān)專業(yè)都開設(shè)了數(shù)字圖像處理這門課程,對(duì)數(shù)字圖像處理教材的需求和要求也在不斷增加。在組織編寫教材過(guò)程中,課題組遵循工程教育認(rèn)證的成果導(dǎo)向理念來(lái)構(gòu)建圖像處理的課程體系;利用圖像信息直觀的特點(diǎn),傳播主流意識(shí)形態(tài)的道德價(jià)值觀和思想政治理念,在潛移默化中展現(xiàn)課程思政;跟隨人工智能、計(jì)算機(jī)等新技術(shù)的發(fā)展步伐,更新圖像處理的教學(xué)內(nèi)容和開發(fā)工具,努力推出實(shí)用性強(qiáng)、針對(duì)性強(qiáng)的數(shù)字圖像處理教材。編者多年從事數(shù)字圖像處理課程教學(xué),收集、整理了大量的經(jīng)典算法和應(yīng)用,在此將多年來(lái)對(duì)數(shù)字圖像處理技術(shù)的探索心得與大家共享。
本書主要內(nèi)容
總體上,數(shù)字圖像處理分三個(gè)層次:低級(jí)圖像處理、中級(jí)圖像處理和高級(jí)圖像處理。本書主要介紹低級(jí)圖像處理和中級(jí)圖像處理,也就是對(duì)圖像進(jìn)行各種加工以改善圖像的視覺(jué)效果或突出有用信息,進(jìn)一步對(duì)圖像中感興趣的目標(biāo)進(jìn)行檢測(cè)(或分割)和測(cè)量,以獲得它們的客觀信息,從而建立對(duì)圖像的描述。本書沒(méi)有介紹高級(jí)圖像處理中的圖像理解及場(chǎng)景解釋等內(nèi)容。
1.低級(jí)圖像處理部分
本書的第1章是數(shù)字圖像處理概述,主要介紹了數(shù)字圖像的概念和相關(guān)術(shù)語(yǔ)、數(shù)字圖像處理的特點(diǎn)、數(shù)字圖像處理的主要研究?jī)?nèi)容以及數(shù)字圖像處理的一些經(jīng)典應(yīng)用。
第2章介紹數(shù)字圖像處理的一些基礎(chǔ)知識(shí),包括圖像的數(shù)字化、數(shù)字圖像的表示與坐標(biāo)約定、圖像模式及彩色模型、灰度統(tǒng)計(jì)特征、像素點(diǎn)之間的基本關(guān)系、圖像質(zhì)量評(píng)價(jià)以及Python圖像處理編程基礎(chǔ)等。
第3章介紹空域圖像增強(qiáng)技術(shù),主要介紹了線性灰度變換、非線性灰度變換和直方圖處理等點(diǎn)處理技術(shù),以及空域平滑、空域銳化等鄰域處理技術(shù),分析了點(diǎn)處理和鄰域處理的特點(diǎn)和各種處理技術(shù)的功能效果。
第4章介紹頻域圖像增強(qiáng)技術(shù),主要介紹了通過(guò)傅里葉變換實(shí)現(xiàn)圖像增強(qiáng)的原理和步驟,分析了傅里葉變換的性質(zhì),學(xué)習(xí)了利用頻域信息的特點(diǎn)對(duì)圖像進(jìn)行低通濾波、高通濾波的方法。
第5章介紹圖像復(fù)原技術(shù),主要介紹了線性移不變圖像退化模型及非盲去卷積的圖像復(fù)原原理,對(duì)無(wú)約束圖像復(fù)原(逆濾波)和有約束圖像復(fù)原(維納濾波、約束最小二乘濾波等)等算法進(jìn)行了公式推導(dǎo),并對(duì)各算法進(jìn)行了分析比較。
第6章介紹圖像的幾何變換與幾何校正技術(shù),主要介紹了圖像常用的坐標(biāo)變換和常用的灰度插值方法,進(jìn)一步學(xué)習(xí)了剛體變換、仿射變換、投影變換和非線性變換等幾何變換,簡(jiǎn)單介紹了幾何校正的基本原理。
第7章介紹形態(tài)學(xué)圖像處理技術(shù),主要介紹了基本的形態(tài)學(xué)運(yùn)算,包括腐蝕、膨脹、開運(yùn)算、閉運(yùn)算,分析了利用這些基本運(yùn)算推導(dǎo)和組合成的各種數(shù)學(xué)形態(tài)學(xué)實(shí)用算法,并用這些算法對(duì)圖像形狀和結(jié)構(gòu)進(jìn)行了分析與處理。
2.中級(jí)圖像處理部分
第8章介紹圖像分割技術(shù),闡述了圖像分割的意義,介紹了圖像分割的一些常用方法,包括閾值分割、邊緣檢測(cè)、區(qū)域分割等,著重介紹了一些圖像分割的經(jīng)典算法,包括閾值分割法、區(qū)域生長(zhǎng)法、水域分割法等。
第9章介紹圖像描述和特征提取技術(shù),闡述了圖像描述和特征提取的必要性,介紹了圖像的灰度描述、邊界描述、區(qū)域描述、紋理描述方法,著重介紹了圖像的直方圖特征、鏈碼描述和傅里葉描述、幾何特征和不變矩、矩分析法和灰度共生矩陣法等,較詳細(xì)地介紹了HOG特征,分析了一般圖像識(shí)別系統(tǒng)的工作流程。
第10章介紹一個(gè)較為完整的車牌識(shí)別系統(tǒng)。本章教學(xué)內(nèi)容與配套的算法演示系統(tǒng)相結(jié)合,讓讀者對(duì)圖像處理系統(tǒng)有一個(gè)較為全面的認(rèn)識(shí)。
本書特點(diǎn)
(1) 內(nèi)容新穎、實(shí)用性強(qiáng)。隨著人工智能的發(fā)展,越來(lái)越多的工程應(yīng)用和教學(xué)研究都使用Python語(yǔ)言,本教材的例題都是使用Python語(yǔ)言實(shí)現(xiàn)的,符合實(shí)際應(yīng)用的需要。本教材緊跟新技術(shù)發(fā)展前沿,收集了一些人工智能、計(jì)算機(jī)等方面的新技術(shù)應(yīng)用。
(2) 示例典型豐富、內(nèi)容完整。在多年的數(shù)字圖像處理教學(xué)過(guò)程中,筆者收集、整理了大量經(jīng)典例題,并在編書過(guò)程中有所選擇,以方便讀者較全面地了解圖像增強(qiáng)、圖像變換、圖像復(fù)原、幾何變換、形態(tài)學(xué)處理、圖像分割、圖像描述、特征提取等經(jīng)典圖像處理技術(shù)。
(3) 教學(xué)資料豐富。筆者汲取了國(guó)內(nèi)外圖像處理的教學(xué)經(jīng)驗(yàn),整理了一套較為完整和實(shí)用的教學(xué)資料,包括PPT課件、練習(xí)習(xí)題、圖像處理實(shí)驗(yàn)指導(dǎo)書以及“基于Python的圖像處理算法演示系統(tǒng)v1.0”等。
教學(xué)安排
本書介紹了數(shù)字圖像處理的基礎(chǔ)知識(shí)和數(shù)字圖像處理編程技術(shù),學(xué)習(xí)本書需要數(shù)字信號(hào)處理的基礎(chǔ)知識(shí)以及Python程序設(shè)計(jì)知識(shí)。
作為教材,筆者推薦的總課時(shí)是48課時(shí)。建議在上完本課程后,再開設(shè)一到兩周的數(shù)字圖像處理的課程設(shè)計(jì),以鞏固數(shù)字圖像處理的知識(shí),并加強(qiáng)同學(xué)們的數(shù)字圖像處理程序設(shè)計(jì)能力。推薦的課時(shí)分配見下表。課時(shí)分配表
序號(hào)課時(shí)教 學(xué) 內(nèi) 容實(shí) 驗(yàn) 內(nèi) 容12第1章圖像處理概述26第2章圖像處理基礎(chǔ)知識(shí)310第3章空域圖像增強(qiáng)空域圖像增強(qiáng)實(shí)驗(yàn)48第4章頻域圖像增強(qiáng)頻域圖像增強(qiáng)實(shí)驗(yàn)56第5章圖像復(fù)原圖像復(fù)原實(shí)驗(yàn)62第6章圖像的幾何變換與幾何校正72第7章形態(tài)學(xué)圖像處理86第8章圖像分割圖像分割實(shí)驗(yàn)94第9章圖像描述與特征提取102自主安排相關(guān)教學(xué)
致謝
本書由蔡體健和劉偉主編,參編人員包括王杉、劉志偉、劉遵雄、鄧芳芳。編寫分工如下:蔡體健編寫了第2、3、4、6、9章,劉偉編寫了第5、7、8章,王杉編寫了第1章,劉遵雄編寫了第10章,鄧芳芳編寫了附錄。本書由蔡體健和劉志偉負(fù)責(zé)統(tǒng)稿。
編者在教材編寫過(guò)程中參考了都柏林理工學(xué)院Brian Mac Namee教授、巴塞爾大學(xué)Philippe Cattin教授、斯坦福大學(xué)Gordon Wetzstein教授、休斯頓大學(xué)Shishir K.Shah博士、山東大學(xué)陳輝教授等的數(shù)字圖像處理課件;此外,還得到了華東交通大學(xué)人工智能系的支持,在此表示感謝。由于編者水平有限,時(shí)間也比較倉(cāng)促,書中的錯(cuò)誤和不妥之處在所難免,敬請(qǐng)讀者批評(píng)指正。
編者
第1章圖像處理概述
1.1數(shù)字圖像
1.2數(shù)字圖像處理
1.2.1什么是數(shù)字圖像處理
1.2.2數(shù)字圖像處理的基本特點(diǎn)
1.2.3相關(guān)學(xué)科與領(lǐng)域
1.3數(shù)字圖像處理的研究?jī)?nèi)容
1.3.1數(shù)字圖像處理的三個(gè)層次
1.3.2數(shù)字圖像處理課程的主要
研究?jī)?nèi)容
1.3.3數(shù)字圖像處理中的幾種
運(yùn)算處理
1.4數(shù)字圖像處理的經(jīng)典應(yīng)用
1.4.1天文方面的應(yīng)用
1.4.2遙感圖像應(yīng)用
1.4.3醫(yī)學(xué)圖像應(yīng)用
1.4.4工業(yè)檢測(cè)方面的應(yīng)用
1.4.5公安執(zhí)法方面的應(yīng)用
1.4.6智能監(jiān)控方面的應(yīng)用
1.4.7文體藝術(shù)圖像應(yīng)用
1.4.8圖像檢索
1.4.9辦公室自動(dòng)化圖像應(yīng)用
1.5數(shù)字圖像處理的發(fā)展趨勢(shì)
練習(xí)
第2章圖像處理基礎(chǔ)知識(shí)
2.1圖像的數(shù)字化
2.1.1圖像采樣
2.1.2圖像量化
2.1.3非均勻采樣與量化
2.2數(shù)字圖像的表示
2.2.1圖像的數(shù)學(xué)表示
2.2.2在計(jì)算機(jī)中的矩陣表示
2.2.3坐標(biāo)約定
2.3圖像模式及彩色模型
2.3.1圖像模式
2.3.2RGB彩色模型
2.3.3HSI彩色模型
2.3.4彩色模型之間的相互轉(zhuǎn)換
2.4圖像的灰度分布——直方圖
2.5像素點(diǎn)之間的基本關(guān)系
2.5.1像素與鄰域
2.5.2鄰接性、連通性、區(qū)域和邊界
2.5.3距離度量
2.6圖像質(zhì)量評(píng)價(jià)
2.6.1主觀評(píng)價(jià)
2.6.2客觀評(píng)價(jià)
2.6.3常用的評(píng)價(jià)指標(biāo)
2.7Python的圖像處理編程
2.7.1Python圖像處理工具包
2.7.2可視化工具包
練習(xí)
第3章空域圖像增強(qiáng)
3.1圖像增強(qiáng)方法
3.2灰度變換
3.2.1線性灰度變換
3.2.2非線性灰度變換
3.3基于直方圖的灰度變換
3.3.1直方圖均衡化
3.3.2直方圖規(guī)定化
3.4空域?yàn)V波與鄰域運(yùn)算
3.5空域平滑濾波
3.5.1均值濾波
3.5.2高斯濾波
3.5.3閾值鄰域平滑濾波
3.5.4中值濾波
3.6空域銳化濾波
3.6.1一階微分算子
3.6.2二階微分算子
3.6.3梯度的各向同性
3.7空域?yàn)V波與卷積運(yùn)算
3.7.1空域低通濾波與高通濾波
3.7.2圖像濾波邊界處理
3.7.3相關(guān)運(yùn)算與卷積運(yùn)算
練習(xí)
第4章頻域圖像增強(qiáng)
4.1傅里葉變換原理
4.2離散傅里葉變換
4.2.1一維離散傅里葉變換
4.2.2離散傅里葉變換的矩陣向量
表示形式
4.2.3一維離散卷積
4.2.4二維離散傅里葉變換
4.3數(shù)字圖像的傅里葉變換性質(zhì)
4.3.1可分離性
4.3.2共軛對(duì)稱性
4.3.3周期性
4.3.4平移性
4.3.5旋轉(zhuǎn)不變性
4.3.6卷積定理
4.4頻域圖像平滑
4.4.1理想低通濾波器
4.4.2巴特沃斯低通濾波器
4.4.3高斯低通濾波器
4.5頻域圖像銳化
4.5.1理想高通濾波器
4.5.2巴特沃斯高通濾波器
4.5.3高斯高通濾波器
4.6空域?yàn)V波與頻域?yàn)V波的關(guān)系
練習(xí)
第5章圖像復(fù)原
5.1圖像復(fù)原與圖像增強(qiáng)的關(guān)系
5.2噪聲模型及去噪方法
5.2.1噪聲模型
5.2.2噪聲仿真
5.2.3空域?yàn)V波去噪方法
5.2.4頻域?yàn)V波去噪方法
5.3圖像退化模型
5.3.1線性移不變退化模型
5.3.2退化函數(shù)的估計(jì)
5.3.3平面運(yùn)動(dòng)模糊退化模型
5.4圖像復(fù)原算法
5.4.1無(wú)約束的圖像復(fù)原
5.4.2有約束的圖像復(fù)原
5.5補(bǔ)充數(shù)學(xué)知識(shí)
5.5.1卷積的矩陣向量表示
5.5.2循環(huán)矩陣的對(duì)角形式
練習(xí)
第6章圖像的幾何變換與
幾何校正
6.1基本的坐標(biāo)變換
6.1.1圖像平移
6.1.2鏡像變換
6.1.3圖像旋轉(zhuǎn)
6.1.4圖像縮放
6.2灰度插值運(yùn)算
6.2.1最近鄰插值
6.2.2雙線性插值
6.2.3雙三次插值
6.3圖像幾何變換類別
6.3.1剛體變換
6.3.2仿射變換
6.3.3投影變換
6.3.4非線性變換
6.4圖像的幾何校正
6.4.1圖像的幾何畸變描述
6.4.2圖像幾何校正方法
練習(xí)
第7章形態(tài)學(xué)圖像處理
7.1形態(tài)學(xué)基礎(chǔ)
7.1.1集合運(yùn)算
7.1.2結(jié)構(gòu)元素與形態(tài)學(xué)運(yùn)算
7.2基本的形態(tài)學(xué)運(yùn)算
7.2.1腐蝕運(yùn)算
7.2.2膨脹運(yùn)算
7.2.3開運(yùn)算
7.2.4閉運(yùn)算
7.3形態(tài)學(xué)算法
7.3.1邊界提取
7.3.2區(qū)域填充
7.3.3連通分量提取
7.3.4骨架提取
練習(xí)
第8章圖像分割
8.1圖像分割技術(shù)簡(jiǎn)介
8.2閾值分割
8.2.1直方圖閾值法
8.2.2基本全局閾值法
8.2.3最大類間方差法
8.2.4移動(dòng)平均變閾值法
8.2.5自適應(yīng)閾值法
8.3邊緣檢測(cè)與連接
8.3.1邊緣檢測(cè)
8.3.2邊界連接
8.4區(qū)域分割法
8.4.1區(qū)域生長(zhǎng)法
8.4.2分裂合并法
8.4.3圖像水域分割
練習(xí)
第9章圖像描述與特征提取
9.1灰度描述
9.1.1幅度特征
9.1.2變換系數(shù)特征
9.1.3直方圖特征
9.2邊界描述
9.2.1鏈碼描述
9.2.2傅里葉描述
9.3區(qū)域描述
9.3.1幾何特征
9.3.2矩
9.4紋理描述
9.4.1矩分析法
9.4.2灰度差分統(tǒng)計(jì)法
9.4.3灰度共生矩陣法
9.5常用的特征提取算法
9.6MNIST手寫數(shù)字識(shí)別系統(tǒng)
練習(xí)
第10章車牌識(shí)別系統(tǒng)
10.1車牌識(shí)別系統(tǒng)的主要組成和
工作流程
10.2車牌檢測(cè)與定位模塊
10.2.1邊緣檢測(cè)和數(shù)學(xué)形態(tài)學(xué)處理
10.2.2大小形狀特征
10.2.3仿射校正
10.2.4顏色特征
10.3車牌字符分割模塊
10.3.1字符分割前的預(yù)處理
10.3.2水平投影去除上下邊界
10.3.3垂直投影字符分割法
10.4車牌識(shí)別模塊
10.4.1準(zhǔn)備數(shù)據(jù)樣本
10.4.2訓(xùn)練模型階段
10.4.3識(shí)別字符階段
練習(xí)
附錄圖像處理實(shí)驗(yàn)指導(dǎo)
(Python版)
實(shí)驗(yàn)一Python圖像處理編程基礎(chǔ)
實(shí)驗(yàn)二空域圖像增強(qiáng)
實(shí)驗(yàn)三頻域圖像增強(qiáng)
實(shí)驗(yàn)四圖像復(fù)原
實(shí)驗(yàn)五圖像分割
參考文獻(xiàn)