劉長紅所著《復(fù)雜場景下人體動作識別》在對人 體動作識別與行為理解學(xué)習(xí)研究的基礎(chǔ)上,從實際應(yīng) 用角度出發(fā)編寫而成。全書共7章,重點闡述在現(xiàn)實 復(fù)雜場景(如人體表觀變化、雜亂背景和視角變化等) 下的人體動作識別技術(shù)和方法。第l章介紹人體動作 識別的意義、典型應(yīng)用和難點問題;第2章主要對人 體動作識別研究現(xiàn)狀進(jìn)行介紹;第3章論述在雜亂背 景和攝像機(jī)移動場景下的時空興趣點檢測方法;第4 章介紹基于視頻抖動檢測算法的混合時空興趣點檢測 ;第5章介紹基于稀疏編碼的時空金字塔匹配的人體 動作識別方法;第6章介紹視角無關(guān)的人體動作識別 方法;第7章介紹復(fù)雜場景下魯棒的人體動作分類方 法。
本書主要供圖像處理與模式識別、計算機(jī)科學(xué)與 技術(shù)、控制科學(xué)與工程、信息與通信工程等學(xué)科領(lǐng)域 的研究人員、研究生以及工程技術(shù)人員參考使用。
劉長紅,博士,主要研究方向為圖像處理與模式識別、計算機(jī)視覺、機(jī)器學(xué)習(xí)等;在重要學(xué)術(shù)刊物上發(fā)表論文9篇,其中E1收錄3篇;主持完成江西省教育廳科學(xué)技術(shù)研究項目l項、江西師范大學(xué)青年成長基金項目1項和博士啟動基金l項,目前主持承擔(dān)江西省教育廳科學(xué)技術(shù)研究項目1項,參與國家自然科學(xué)基金項目3項;近年來負(fù)責(zé)研發(fā)智能視頻分析系統(tǒng)、智能交通監(jiān)控系統(tǒng)、車牌識別以及視頻質(zhì)量診斷系統(tǒng)等項目。
第1章 引言
1.1 應(yīng)用背景
1.1.1 視頻標(biāo)注與檢索
1.1.2 智能視頻監(jiān)控
1.1.3 人機(jī)交互
1.2 研究的難點
1.3 研究內(nèi)容和結(jié)構(gòu)安排
1.3.1 研究內(nèi)容及工作進(jìn)展
1.3.2 結(jié)構(gòu)安排
第2章 人體動作識別的相關(guān)綜述
2.1 視頻圖像表示
2.1.1 全局表示
2.1.2 局部表示
2.2 人體動作建模與分類
2.2.1 維數(shù)約簡 第1章 引言
1.1 應(yīng)用背景
1.1.1 視頻標(biāo)注與檢索
1.1.2 智能視頻監(jiān)控
1.1.3 人機(jī)交互
1.2 研究的難點
1.3 研究內(nèi)容和結(jié)構(gòu)安排
1.3.1 研究內(nèi)容及工作進(jìn)展
1.3.2 結(jié)構(gòu)安排
第2章 人體動作識別的相關(guān)綜述
2.1 視頻圖像表示
2.1.1 全局表示
2.1.2 局部表示
2.2 人體動作建模與分類
2.2.1 維數(shù)約簡
2.2.2 直接分類
2.2.3 狀態(tài)空間模型方法
2.3 方法的特點
2.4 本章小結(jié)
第3章 雜亂背景和攝像機(jī)移動下的時空興趣點檢測方法
3.1 引言
3.2 非線性各向異性擴(kuò)散濾波器及分析
3.2.1 Perona—Malik擴(kuò)散模型
3.2.2 非線性各向異性擴(kuò)散濾波
3.3 雜亂背景和攝像機(jī)移動下的時空興趣點檢測
3.3.1 基于非線性各向異性擴(kuò)散濾波的時空興趣點檢測算法
3.3.2 計算方法
3.4 實驗與分析
3.4.1 實驗數(shù)據(jù)集和實驗設(shè)置
3.4.2 攝像機(jī)輕微晃動下的時空興趣點檢測方法比較
3.4.3 雜亂背景和攝像機(jī)快速運動下的時空興趣點檢測方法比較
3.4.4 計算復(fù)雜度分析
3.5 本章小結(jié)
第4章 改進(jìn)的視頻抖動自適應(yīng)的時空興趣點檢測方法
4.1 引言
4.2 視頻抖動檢測算法
4.2.1 視頻畫面抖動檢測算法
4.2.2 金字塔Lucas—Kanade稀疏光流特征
4.2.3 稀疏光流的前一后向誤差估計
4.2.4 基于光流運動熵的視頻畫面抖動檢測算法
4.3 基于視頻抖動檢測算法的混合時空興趣點檢測
4.4 實驗與分析
4.4.1 實驗數(shù)據(jù)集和實驗設(shè)置
4.4.2 視頻抖動檢測驗證
4.4.3 靜態(tài)背景下的時空興趣點檢測方法比較
4.4.4 攝像機(jī)輕微晃動下的時空興趣點檢測方法比較
4.4.5 雜亂背景和攝像機(jī)快速運動下的時空興趣點檢測方法比較
4.5 本章小結(jié)
第5章 基于稀疏編碼的時空金字塔匹配的人體動作識別
5.1 引言
5.2 稀疏編碼
5.2.1 數(shù)學(xué)描述
5.2.2 稀疏編碼算法
5.3 基于BoF的人體動作識別框架
5.4 基于稀疏編碼的人體動作識別方法
5.4.1 特征檢測和表示
5.4.2 基于稀疏編碼的碼書學(xué)習(xí)
5.4.3 基于max pooling的人體動作描述子
5.5 基于稀疏編碼的時空金字塔匹配
5.5.1 時空金字塔匹配
5.5.2 基于max pooIing的時空金字塔匹配
5.6 實驗與分析
5.6.1 實驗設(shè)置
5.6.2 KTH數(shù)據(jù)集上的實驗
5.6.3 YouTube數(shù)據(jù)集上的實驗
5.7 本章小結(jié)
第6章 視角無關(guān)的人體動作識別的研究
6.1 引言
6.2 視角無關(guān)的人體動作識別的研究現(xiàn)狀
6.3 線性動態(tài)系統(tǒng)
6.3.1 模型參數(shù)估計
6.3.2 距離度量
6.4 基于線性動態(tài)系統(tǒng)的視角無關(guān)的人體動作識別
6.4.1 基于LDSs模型參數(shù)的局部描述子
6.4.2 模型參數(shù)空間中的碼書學(xué)習(xí)
6.4.3 動作描述子計算
6.5 實驗與分析
6.5.1 數(shù)據(jù)集與實驗設(shè)置
6.5.2 單/多目識別
6.5.3 交叉視角的識別
6.5.4 基于BoF的視角無關(guān)的動作識別方法比較
6.6 本章小結(jié)
第7章 復(fù)雜場景下魯棒的人體動作分類方法
7.1 引言
7.2 超完備基的圖像稀疏表示
7.3 基于稀疏表示的人體動作分類算法
7.3.1 人體動作的稀疏表示
7.3.2 基于l1最小化的稀疏表示求解方法
7.3.3 l1最小化優(yōu)化算法
7.3.4 分類方法
7.4 在噪聲、干擾、遮擋情況下的人體動作分類算法
7.5 實驗與分析
7.5.1 基于l1與l2最小化算法的比較
7.5.2 分類方法SR與SVM、K—NN的比較
7.5.3 魯棒性測試
7.6 本章小結(jié)
參考文獻(xiàn)
名詞索引