本書是你了解計算機視覺的一站式指南。利用Python、TensorFlow、Keras和OpenCV的功能執(zhí)行圖像處理、對象檢測、特征檢測等項目。通過對卷積神經(jīng)網(wǎng)絡的介紹,你將學習如何使用Keras構建深度神經(jīng)網(wǎng)絡,以及如何使用它對Fashion-MNIST數(shù)據(jù)集進行分類。關于對象檢測,你將學習到使用TensorFlow實現(xiàn)簡單的面部檢測器,以及復雜的基于深度學習的對象檢測器(例如Faster R-CNN和SSD)的工作原理。你也將學會使用FCN模型進行語義分割,并使用DeepSORT跟蹤對象。不僅如此,你還將學習到在標準數(shù)據(jù)集上使用視覺SLAM(vSLAM)技術,例如ORB-SLAM。
本書適合希望以*實際的方式理解和實現(xiàn)與計算機視覺和圖像處理相關的各種任務的機器學習從業(yè)人員和深度學習學習者閱讀。
第1章 計算機視覺快速入門
1.1 什么是計算機視覺
1.2 計算機視覺無處不在
1.3 入門
1.3.1 讀取圖像
1.3.2 圖像顏色轉換
1.4 計算機視覺研究的相關會議
1.5 小結
第2章 庫、開發(fā)平臺和數(shù)據(jù)集
2.1 庫及其安裝方法
2.1.1 安裝Anaconda
2.1.2 安裝OpenCV
2.1.3 用于深度學習的TensorFlow
2.1.4 用于深度學習的Keras
2.2 數(shù)據(jù)集
2.2.1 ImageNet
2.2.2 MNIST
2.2.3 CIFAR-10
2.2.4 Pascal VOC
2.2.5 MSCOCO
2.2.6 TUM RGB-D數(shù)據(jù)集
2.3 小結
參考文獻
第3章 OpenCV中的圖像濾波和變換
3.1 數(shù)據(jù)集和庫
3.2 圖像處理
3.3 濾波器概述
3.3.1 線性濾波器
3.3.2 非線性濾波器
3.3.3 圖像梯度
3.4 圖像變換
3.4.1 平移
3.4.2 旋轉
3.4.3 仿射變換
3.5 圖像金字塔
3.6 小結
第4章 什么是特征
4.1 特征用例
4.1.1 數(shù)據(jù)集和庫
4.1.2 為何特征如此重要
4.2 Harris角點檢測
4.2.1 FAST特征
4.2.2 ORB特征
4.2.3 黑箱特征
4.2.4 應用—在圖像中檢測目標對象
4.2.5 應用—是否相似
4.3 小結
參考文獻
第5章 卷積神經(jīng)網(wǎng)絡
5.1 數(shù)據(jù)集和庫
5.2 神經(jīng)網(wǎng)絡簡介
5.2.1 一個簡單的神經(jīng)網(wǎng)絡
5.3 重溫卷積運算
5.4 卷積神經(jīng)網(wǎng)絡
5.4.1 卷積層
5.4.2 激活層
5.4.3 池化層
5.4.4 全連接層
5.4.5 批歸一化
5.4.6 退出
5.5 CNN 實踐
5.5.1 Fashion-MNIST 分類器訓練代碼
5.5.2 CNN 分析
5.5.3 遷移學習
5.6 小結
第6章 基于特征的目標檢測
6.1 目標檢測概述
6.2 目標檢測挑戰(zhàn)
6.3 數(shù)據(jù)集和庫
6.4 目標檢測方法
6.4.1 基于深度學習的目標檢測
6.5 小結
參考文獻
第7章 分割和跟蹤
7.1 數(shù)據(jù)集和庫
7.2 分割
7.2.1 分割挑戰(zhàn)
7.2.2 用于分割的CNN
7.2.3 FCN的實現(xiàn)
7.3 跟蹤
7.3.1 跟蹤挑戰(zhàn)
7.3.2 目標跟蹤方法
7.4 小結
參考文獻
第8章 三維計算機視覺
8.1 數(shù)據(jù)集和庫
8.2 應用
8.3 成像原理
8.4 圖像對齊
8.5 視覺里程計
8.6 視覺SLAM
8.7 小結
參考文獻
第9章 計算機視覺中的數(shù)學
9.1 數(shù)據(jù)集和庫
9.2 線性代數(shù)
9.2.1 向量
9.2.2 矩陣
9.2.3 Hessian矩陣
9.2.4 奇異值分解
9.3 概率論簡述
9.3.1 什么是隨機變量
9.3.2 期望
9.3.3 方差
9.3.4 概率分布
9.3.5 聯(lián)合分布
9.3.6 邊緣分布
9.3.7 條件分布
9.3.8 貝葉斯定理
9.4 小結
第10章 計算機視覺中的機器學習
10.1 什么是機器學習
10.2 機器學習技術分類
10.2.1 監(jiān)督式學習
10.2.2 無監(jiān)督式學習
10.3 維度災難
10.4 機器學習的滾球視角
10.5 常用工具
10.5.1 預處理
10.5.2 后處理
10.6 評估
10.6.1 準確率
10.6.2 召回率
10.6.3 F-分數(shù)
10.7 小結