本書詳細講解了大數(shù)據(jù)應(yīng)用案例(含可運行程序),涉及計算機視覺基礎(chǔ)案例分析、視覺大數(shù)據(jù)檢索及識別相關(guān)的工程應(yīng)用,包含了音視頻處理、目標檢測、圖像識別等行業(yè)應(yīng)用案例,作者從項目實戰(zhàn)出發(fā),對視覺大數(shù)據(jù)工程應(yīng)用的算法設(shè)計、程序?qū)崿F(xiàn)、部署實施進行詳細敘述,可方便讀者進行相關(guān)知識點的程序化調(diào)試及工程復(fù)用。 本書以案例為基礎(chǔ),結(jié)構(gòu)布局緊湊,內(nèi)容深入淺出,實驗簡捷高效,適合計算機、信號通信和自動化等相關(guān)專業(yè)的教師、本科生、研究生,以及廣大從事大數(shù)據(jù)處理的工程研發(fā)人員閱讀參考。
近年來,隨著國家對高新科技的大力支持,以及人工智能技術(shù)的進一步發(fā)展,大數(shù)據(jù)技術(shù)的理論和實踐都取得了進一步發(fā)展和應(yīng)用。特別是將大數(shù)據(jù)與工程實踐應(yīng)用的結(jié)合,通過大數(shù)據(jù)智能算法進行分析挖掘,形成了一系列的工程化應(yīng)用,取得了良好的社會效益和經(jīng)濟效益。本書的籌劃就是立足于視覺大數(shù)據(jù)的工程案例實踐,對工程應(yīng)用過程中遇到的實際問題進行分析、設(shè)計、開發(fā)、實施,從理論介紹、算法架構(gòu)、程序?qū)崿F(xiàn)、部署實施的角度進行敘述,具有明顯的工程實用性特色。
本書詳細講解了視覺大數(shù)據(jù)應(yīng)用案例(含可運行程序),涉及計算機視覺基礎(chǔ)案例分析、視覺大數(shù)據(jù)檢索及識別相關(guān)的工程應(yīng)用,包含音視頻處理、目標檢測、圖像識別等行業(yè)應(yīng)用案例,作者從項目實戰(zhàn)出發(fā),對視覺大數(shù)據(jù)工程應(yīng)用的算法設(shè)計、程序?qū)崿F(xiàn)、部署實施進行詳細敘述,可方便讀者進行相關(guān)知識點的程序化調(diào)試及工程復(fù)用。
本書全面而細致地講解了視覺大數(shù)據(jù)智能分析案例,全書分為3篇,共16章,主要內(nèi)容如下。
第1篇是基礎(chǔ)篇,包括第1~3章,分別對基于圖像分割的答題卡智能識別、基于圖像增強的霧天圖像優(yōu)化方法、基于顏色特征的森林火情預(yù)警識別方法進行闡述,層層深入地介紹了圖像分割、圖像增強、分類識別等模塊的相關(guān)理論和實踐知識。
第2篇是進階篇,包括第4~10章,分別對基于混沌編碼的圖像加密算法應(yīng)用、基于信息隱藏的多格式文件加密算法應(yīng)用、基于顏色分割的道路信號燈檢測識別應(yīng)用、融合GPS及視覺詞袋模型的建筑物匹配識別應(yīng)用、基于人臉識別的課堂考勤打卡計時應(yīng)用、基于車牌識別的停車場出入庫計費應(yīng)用、基于光流場的交通流量分析應(yīng)用進行闡述,深入介紹了圖像加密、信息隱藏、圖像分割、圖像匹配、分類識別、視頻跟蹤等模塊的相關(guān)理論和實踐知識。
第3篇是應(yīng)用篇,包括第11~16章,分別對基于卷積神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識別應(yīng)用、基于視覺大數(shù)據(jù)檢索的圖搜圖應(yīng)用、驗證碼AI識別、基于生成式對抗網(wǎng)絡(luò)的圖像生成應(yīng)用、COVID19新冠肺炎影像智能識別、基于深度學(xué)習(xí)的人臉二維碼識別進行闡述,深入介紹了字符識別、圖像檢索、人臉二維碼識別等模塊的相關(guān)理論和實踐知識。
在本書的編寫過程中,得到了山東文多網(wǎng)絡(luò)有限公司AI視覺工程實驗室的大力支持,在此表示衷心的感謝。本書寫作之初還得到清華大學(xué)出版社編輯王芳的鼓勵和支持,在此深表謝意。后,作者對本書所引用的參考文獻和博文的作者表示感謝,同時對各位讀者給予的啟發(fā)和幫助表示感謝。后,感謝家人的默默支持,特別是女兒劉沛萌的陪伴與鼓勵,讓我成為一名勇往直前的父親,也祝天下小朋友都能健康快樂成長!
由于時間倉促,加之作者的水平和經(jīng)驗有限,書中疏漏及不足在所難免,希望廣大讀者批評指正。
劉衍琦
2021年12月
基礎(chǔ)篇
第1章基于圖像分割的答題卡智能識別
1.1應(yīng)用背景
1.2答題卡預(yù)處理
1.3答題卡網(wǎng)格化分割
1.4答題區(qū)域檢測
1.5答案識別
1.5.1字符模板圖像生成
1.5.2字符模板匹配識別
1.5.3識別結(jié)果可視化
1.6案例小結(jié)
第2章基于圖像增強的霧天圖像優(yōu)化方法
2.1應(yīng)用背景
2.2霧天圖像增強方法
2.2.1全局直方圖增強
2.2.2CLAHE增強
2.2.3Retinex增強
2.3增強效果評測
2.4集成應(yīng)用開發(fā)
2.5案例小結(jié)
第3章基于顏色特征的森林火情預(yù)警識別方法
3.1應(yīng)用背景
3.2火情特征分析
3.2.1RGB顏色空間
3.2.2HSV顏色空間
3.2.3CMYK顏色空間
3.3火情區(qū)域檢測
3.4集成應(yīng)用開發(fā)
3.5案例小結(jié)
進階篇
第4章基于混沌編碼的圖像加密算法應(yīng)用
4.1應(yīng)用背景
4.2圖像加密
4.2.1Logistic混沌系統(tǒng)
4.2.2離散余弦變換壓縮
4.2.3混沌加密
4.3圖像解密
4.3.1混沌解密
4.3.2效果評測
4.3.3攻擊評測
4.4集成應(yīng)用開發(fā)
4.5案例小結(jié)
第5章基于信息隱藏的多格式文件加密算法應(yīng)用
5.1應(yīng)用背景
5.2信息隱藏加密
5.2.1LSB信息隱藏
5.2.2Base64編解碼
5.2.3多格式文件隱藏加密
5.3信息提取解密
5.3.1LSB信息提取
5.3.2多格式文件提取解密
5.4集成應(yīng)用開發(fā)
5.5案例小結(jié)
第6章基于顏色分割的道路信號燈檢測識別應(yīng)用
6.1應(yīng)用背景
6.2信號燈特征分析
6.3信號燈檢測識別
6.4集成應(yīng)用開發(fā)
6.5案例小結(jié)
第7章融合GPS及視覺詞袋模型的建筑物匹配識別應(yīng)用
7.1應(yīng)用背景
7.2圖像GPS屬性解析
7.3圖像視覺詞袋建模
7.3.1局部特征提取
7.3.2視覺詞袋構(gòu)建
7.3.3圖像匹配識別
7.4集成應(yīng)用開發(fā)
7.5案例小結(jié)
第8章基于人臉識別的課堂考勤打卡計時應(yīng)用
8.1應(yīng)用背景
8.2人臉檢測
8.2.1基于膚色的人臉檢測方法
8.2.2基于統(tǒng)計學(xué)習(xí)的人臉檢測方法
8.3人臉識別
8.3.1人臉庫構(gòu)建
8.3.2人臉特征提取
8.3.3人臉分類識別
8.4集成應(yīng)用開發(fā)
8.5案例小結(jié)
第9章基于車牌識別的停車場出入庫計費應(yīng)用
9.1應(yīng)用背景
9.2車牌檢測
9.2.1基于顏色的車牌檢測方法
9.2.2基于統(tǒng)計學(xué)習(xí)的車牌檢測方法
9.3車牌識別
9.3.1字符分割
9.3.2字符識別
9.4集成應(yīng)用開發(fā)
9.5案例小結(jié)
第10章基于光流場的交通流量分析應(yīng)用
10.1應(yīng)用背景
10.2視頻解析
10.2.1視頻屬性
10.2.2視頻讀取
10.2.3視頻生成
10.3交通流量分析
10.3.1光流場計算
10.3.2車流量計算
10.4集成應(yīng)用開發(fā)
10.5案例小結(jié)
應(yīng)用篇
第11章基于卷積神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識別應(yīng)用
11.1應(yīng)用背景
11.2卷積神經(jīng)網(wǎng)絡(luò)設(shè)計
11.2.1卷積核
11.2.2特征圖
11.2.3池化降維
11.2.4網(wǎng)絡(luò)定義
11.3卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練評測
11.3.1數(shù)據(jù)集準備
11.3.2數(shù)據(jù)集解析
11.3.3網(wǎng)絡(luò)訓(xùn)練
11.3.4網(wǎng)絡(luò)測試
11.4集成應(yīng)用開發(fā)
11.4.1界面設(shè)計
11.4.2批量評測
11.4.3單例評測
11.5TensorFlow應(yīng)用開發(fā)
11.5.1數(shù)據(jù)拆分
11.5.2網(wǎng)絡(luò)訓(xùn)練
11.5.3網(wǎng)絡(luò)測試
11.5.4應(yīng)用界面
11.6案例小結(jié)
第12章基于視覺大數(shù)據(jù)檢索的圖搜圖應(yīng)用
12.1應(yīng)用背景
12.2視覺特征提取
12.2.1CNN模型選擇
12.2.2CNN深度特征
12.3視覺特征索引
12.4視覺搜索引擎
12.5集成應(yīng)用開發(fā)
12.6案例小結(jié)
第13章驗證碼AI識別
13.1應(yīng)用背景
13.2驗證碼圖像生成
13.2.1基礎(chǔ)字符模板
13.2.2驗證碼圖模擬
13.2.3驗證碼數(shù)據(jù)庫
13.3驗證碼識別模型
13.3.1CNN模型訓(xùn)練
13.3.2CNN模型測試
13.4集成應(yīng)用開發(fā)
13.4.1數(shù)據(jù)集標注
13.4.2數(shù)據(jù)集分割
13.4.3CNN模型訓(xùn)練
13.4.4CNN模型應(yīng)用
13.5案例小結(jié)
第14章基于生成式對抗網(wǎng)絡(luò)的圖像生成應(yīng)用
14.1應(yīng)用背景
14.2生成式對抗網(wǎng)絡(luò)模型
14.2.1卡通頭像大數(shù)據(jù)
14.2.2GAN網(wǎng)絡(luò)設(shè)計
14.2.3GAN網(wǎng)絡(luò)訓(xùn)練
14.2.4GAN網(wǎng)絡(luò)測試
14.3集成應(yīng)用開發(fā)
14.4案例小結(jié)
第15章COVID19新冠肺炎影像智能識別
15.1應(yīng)用背景
15.2新冠影像識別
15.2.1新冠影像大數(shù)據(jù)
15.2.2CNN遷移設(shè)計
15.2.3CNN遷移訓(xùn)練
15.2.4CNN遷移評測
15.2.5CNN融合識別
15.3集成應(yīng)用開發(fā)
15.4案例小結(jié)
第16章基于深度學(xué)習(xí)的人臉二維碼識別
16.1應(yīng)用背景
16.2QR碼
16.2.1QR編碼
16.2.2QR譯碼
16.2.3內(nèi)容加密
16.3人臉壓縮
16.3.1人臉建庫
16.3.2人臉降維
16.3.3人臉重構(gòu)
16.3.4人臉轉(zhuǎn)碼
16.4CNN分類識別
16.5集成應(yīng)用開發(fā)
16.6案例小結(jié)
參考文獻