定 價(jià):88 元
叢書名:高級(jí)人工智能人才培養(yǎng)叢書
- 作者:劉明堂
- 出版時(shí)間:2021/3/1
- ISBN:9787121384288
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP391.4
- 頁(yè)碼:336
- 紙張:
- 版次:01
- 開本:16開
本書圍繞模式識(shí)別的基本概念、基礎(chǔ)理論和典型方法,從實(shí)際應(yīng)用問題出發(fā),系統(tǒng)描述了模式識(shí)別的常用方法和常見技巧,并給出了一系列實(shí)驗(yàn)及應(yīng)用案例。本書首先介紹了機(jī)器視覺的概念及特征提取的概念和方法;其次介紹了線性分類模型、非線性分類模型、時(shí)間序列預(yù)測(cè)模型和混合模型等理論知識(shí)與實(shí)踐操作;最后重點(diǎn)介紹了圖像識(shí)別、視頻目標(biāo)檢測(cè)與跟蹤、語(yǔ)音識(shí)別、生物特征識(shí)別和醫(yī)學(xué)圖像檢索等典型應(yīng)用。
劉鵬:博士畢業(yè)于清華大學(xué),教授,現(xiàn)任南京大數(shù)據(jù)研究院院長(zhǎng)、中國(guó)大數(shù)據(jù)應(yīng)用聯(lián)盟人工智能專家委員會(huì)主任、中國(guó)大數(shù)據(jù)專家委員會(huì)委員。曾率隊(duì)奪得2002 PennySort國(guó)際計(jì)算機(jī)排序比賽冠軍(這是我國(guó)獲得的第一個(gè)大數(shù)據(jù)比賽世界冠軍),兩次奪得全國(guó)高?萍急荣*高獎(jiǎng),三次奪得清華大學(xué)科技比賽*高獎(jiǎng)。主持完成科研項(xiàng)目25項(xiàng),發(fā)表論文80余篇,出版專業(yè)圖書20部。獲部級(jí)科技進(jìn)步二等獎(jiǎng)4項(xiàng)、三等獎(jiǎng)4項(xiàng)。2002年開創(chuàng)性地提出了“計(jì)算池”模式,被2007年開始流行的“云計(jì)算”所證實(shí)。2003年開創(chuàng)性地提出了“反垃圾郵件網(wǎng)格”,被2008年開始流行的“云安全”所證實(shí)。榮獲“全軍十大學(xué)習(xí)成才標(biāo)兵”、南京市“十大杰出青年”、江蘇省中青年科學(xué)技術(shù)帶頭人、清華大學(xué)“學(xué)術(shù)新秀”等稱號(hào)。劉河,現(xiàn)就職于重慶市教育科學(xué)研究院,中國(guó)計(jì)算機(jī)學(xué)會(huì)會(huì)員,重慶市教育信息化專家委員會(huì)成員;主要研究領(lǐng)域?yàn)榇髷?shù)據(jù)、人工智能等;獨(dú)立開發(fā)了10余個(gè)軟件系統(tǒng),主持主研了多項(xiàng)省部級(jí)重點(diǎn)課題,編著了多部教材,獲得了多個(gè)計(jì)算機(jī)軟件著作權(quán)登記證書。
第1章 緒論 1
1.1 機(jī)器感知與視覺信息 1
1.1.1 機(jī)器感知 1
1.1.2 視覺信息感知 2
1.1.3 視覺機(jī)理 2
1.2 特征選擇與提取 3
1.2.1 特征 3
1.2.2 特征選擇 3
1.2.3 特征提取 4
1.3 模式識(shí)別系統(tǒng) 4
1.3.1 模式與模式識(shí)別 4
1.3.2 模式識(shí)別系統(tǒng) 5
1.4 機(jī)器感知與模式識(shí)別 5
1.5 機(jī)器感知與人工智能的關(guān)系 6
1.6 章節(jié)安排 6
習(xí)題 7
參考文獻(xiàn) 8
第2章 機(jī)器視覺 9
2.1 視覺系統(tǒng) 9
2.1.1 機(jī)器視覺的發(fā)展 9
2.1.2 機(jī)器視覺系統(tǒng)的構(gòu)成與評(píng)價(jià)指標(biāo) 10
2.1.3 機(jī)器視覺的應(yīng)用 12
2.2 硬件系統(tǒng) 14
2.2.1 工業(yè)相機(jī) 15
2.2.2 鏡頭 20
2.2.3 光源 24
2.2.4 其他組成部分 29
2.3 視覺軟件 30
2.4 實(shí)驗(yàn):車牌識(shí)別 31
2.4.1 實(shí)驗(yàn)?zāi)康?31
2.4.2 實(shí)驗(yàn)要求 31
2.4.3 實(shí)驗(yàn)原理 31
2.4.4 實(shí)驗(yàn)環(huán)境 31
2.4.5 實(shí)驗(yàn)步驟 31
習(xí)題 32
參考文獻(xiàn) 33
第3章 特征提取 35
3.1 特征提取簡(jiǎn)述 35
3.2 特征選擇 37
3.2.1 特征方差 38
3.2.2 特征相關(guān)系數(shù) 38
3.2.3 類間距離 38
3.2.4 降維 38
3.3 降維 39
3.3.1 基于PCA的特征提取 40
3.3.2 PCA的步驟 41
3.4 類腦智能 42
3.4.1 模式識(shí)別與人工智能 42
3.4.2 類腦智能的概念 43
3.4.3 類腦智能的技術(shù)框架 44
3.5 模式識(shí)別系統(tǒng)設(shè)計(jì) 45
3.6 計(jì)算學(xué)習(xí)理論 46
3.6.1 基本的PAC模型 47
3.6.2 基本概念 47
3.6.3 問題框架 48
3.6.4 小結(jié) 49
3.7 實(shí)驗(yàn):基于PCA的特征臉提取 49
3.7.1 實(shí)驗(yàn)?zāi)康?49
3.7.2 實(shí)驗(yàn)要求 49
3.7.3 實(shí)驗(yàn)原理 49
3.7.4 實(shí)驗(yàn)步驟 50
3.7.5 實(shí)驗(yàn)結(jié)果 51
習(xí)題 53
參考文獻(xiàn) 53
第4章 線性分類模型 55
4.1 線性判別函數(shù) 55
4.1.1 兩類問題 55
4.1.2 多類問題 57
4.2 Fisher線性判別函數(shù) 59
4.3 感知器算法 62
4.4 最小平方誤差算法 64
4.5 Logistic回歸 65
4.6 基于Python實(shí)現(xiàn)感知器算法 69
4.6.1 基于sklearn庫(kù)實(shí)現(xiàn)感知器算法 69
4.6.2 實(shí)驗(yàn)結(jié)果分析 73
4.7 實(shí)驗(yàn):感知器算法實(shí)現(xiàn) 74
4.7.1 實(shí)驗(yàn)?zāi)康?74
4.7.2 實(shí)驗(yàn)要求 75
4.7.3 實(shí)驗(yàn)原理及具體步驟 75
4.7.4 實(shí)驗(yàn)結(jié)果 77
習(xí)題 79
參考文獻(xiàn) 79
第5章 非線性分類 81
5.1 分段線性判別函數(shù) 81
5.1.1 最小距離分類器 81
5.1.2 一般的分段線性判別函數(shù) 82
5.2 決策樹和隨機(jī)森林 85
5.2.1 樹狀分類過程 85
5.2.2 構(gòu)造決策樹 86
5.2.3 森林分類過程 89
5.3 支持向量機(jī) 90
5.3.1 線性可分情況 90
5.3.2 線性不可分情況 91
5.4 貝葉斯分類網(wǎng)絡(luò) 93
5.4.1 貝葉斯決策的相關(guān)概念 93
5.4.2 最小錯(cuò)誤率貝葉斯決策 94
5.4.3 最小風(fēng)險(xiǎn)貝葉斯決策 95
5.4.4 正態(tài)分布貝葉斯分類 96
5.5 神經(jīng)網(wǎng)絡(luò) 97
5.5.1 神經(jīng)網(wǎng)絡(luò)基本單元 97
5.5.2 前饋神經(jīng)網(wǎng)絡(luò) 98
5.5.3 Hopfield反饋神經(jīng)網(wǎng)絡(luò) 102
5.6 基于Python實(shí)現(xiàn)決策樹和隨機(jī)森林算法 103
5.6.1 決策樹和隨機(jī)森林算法的基本特征 103
5.6.2 實(shí)驗(yàn)結(jié)果分析 106
5.7 實(shí)驗(yàn):決策樹和隨機(jī)森林算法實(shí)現(xiàn) 107
5.7.1 實(shí)驗(yàn)?zāi)康?107
5.7.2 實(shí)驗(yàn)要求 107
5.7.3 實(shí)驗(yàn)原理及步驟 107
5.7.4 實(shí)驗(yàn)結(jié)果 111
習(xí)題 113
參考文獻(xiàn) 113
第6章 時(shí)間序列預(yù)測(cè) 115
6.1 時(shí)間序列預(yù)測(cè)概述 115
6.1.1 時(shí)間序列 115
6.1.2 編制時(shí)間序列的原則 117
6.1.3 時(shí)間序列預(yù)測(cè)方法 118
6.1.4 時(shí)間序列預(yù)測(cè)流程 120
6.1.5 時(shí)間序列預(yù)測(cè)模型評(píng)估 121
6.2 指數(shù)平滑法 122
6.2.1 一次指數(shù)平滑 123
6.2.2 二次指數(shù)平滑 123
6.2.3 三次指數(shù)平滑 124
6.2.4 平滑系數(shù)的選擇 124
6.3 自回歸滑動(dòng)平均模型 124
6.3.1 自回歸模型 125
6.3.2 移動(dòng)平均模型 125
6.3.3 自回歸滑動(dòng)平均模型表示 125
6.3.4 自回歸滑動(dòng)平均模型建模 126
6.4 自回歸積分滑動(dòng)平均模型 128
6.4.1 自回歸積分滑動(dòng)平均模型表示 128
6.4.2 自回歸積分滑動(dòng)平均模型建模 128
6.4.3 案例分析 129
6.5 長(zhǎng)短期記憶網(wǎng)絡(luò)模型 133
6.5.1 循環(huán)神經(jīng)網(wǎng)絡(luò) 134
6.5.2 長(zhǎng)短期記憶網(wǎng)絡(luò) 134
6.6 實(shí)驗(yàn):基于LSTM的股票最高價(jià)預(yù)測(cè) 135
6.6.1 實(shí)驗(yàn)?zāi)康?135
6.6.2 實(shí)驗(yàn)要求 135
6.6.3 實(shí)驗(yàn)原理 136
6.6.4 實(shí)驗(yàn)步驟 137
6.6.5 實(shí)驗(yàn)結(jié)果 141
習(xí)題 143
參考文獻(xiàn) 143
第7章 混合模型 145
7.1 高斯模型與高斯混合模型 145
7.1.1 高斯模型 145
7.1.2 高斯混合模型 146
7.2 貝葉斯混合模型 147
7.3 集成學(xué)習(xí) 148
7.3.1 Boosting 149
7.3.2 AdaBoost 149
7.4 實(shí)驗(yàn):基于AdaBoost集成學(xué)習(xí)的乳腺癌分類 153
7.4.1 實(shí)驗(yàn)?zāi)康?153
7.4.2 實(shí)驗(yàn)要求 154
7.4.3 實(shí)驗(yàn)原理 154
7.4.4 實(shí)驗(yàn)內(nèi)容 156
7.4.5 實(shí)驗(yàn)結(jié)果 162
習(xí)題 163
參考文獻(xiàn) 163
第8章 圖像識(shí)別 164
8.1 數(shù)字圖像處理系統(tǒng) 164
8.1.1 圖像感知與獲取 164
8.1.2 圖像處理硬件 165
8.1.3 圖像處理軟件 166
8.1.4 圖像的顯示和存儲(chǔ) 166
8.2 圖像特征描述 167
8.2.1 幾何特征 167
8.2.2 形狀特征 170
8.2.3 顏色特征 172
8.2.4 紋理特征 173
8.3 圖像特征提取 175
8.3.1 基于Hu不變矩的形狀特征提取 175
8.3.2 基于聯(lián)合概率矩陣法的紋理特征提取 177
8.3.3 分塊顏色直方圖特征提取 178
8.3.4 基于小波變換的圖像特征提取 179
8.4 目標(biāo)識(shí)別 180
8.4.1 結(jié)構(gòu)判別方法 181
8.4.2 決策理論方法 183
8.5 基于區(qū)域生長(zhǎng)法的圖像識(shí)別 186
8.5.1 區(qū)域生長(zhǎng)法的基本原理 186
8.5.2 基于區(qū)域生長(zhǎng)法的裂縫識(shí)別系統(tǒng) 188
8.5.3 實(shí)驗(yàn)結(jié)果分析 189
8.6 實(shí)驗(yàn):水泥面裂縫檢測(cè) 191
8.6.1 實(shí)驗(yàn)?zāi)康?191
8.6.2 實(shí)驗(yàn)要求 191
8.6.3 實(shí)驗(yàn)原理 191
8.6.4 實(shí)驗(yàn)步驟 192
8.6.5 實(shí)驗(yàn)結(jié)果 192
習(xí)題 193
參考文獻(xiàn) 194
第9章 視頻目標(biāo)檢測(cè)與跟蹤 196
9.1 視頻目標(biāo)檢測(cè) 196
9.1.1 幀間差分法 196
9.1.2 光流法 197
9.1.3 背景減除法 198
9.1.4 目標(biāo)檢測(cè)在復(fù)雜場(chǎng)景中應(yīng)用的困難 202
9.2 運(yùn)動(dòng)目標(biāo)跟蹤 202
9.2.1 MeanShift跟蹤算法 202
9.2.2 卡爾曼濾波跟蹤算法 205
9.2.3 多目標(biāo)跟蹤算法 208
9.3 運(yùn)動(dòng)目標(biāo)檢測(cè)的性能評(píng)價(jià) 211
9.3.1 主觀評(píng)價(jià) 212
9.3.2 客觀評(píng)價(jià) 212
9.4 圖像視頻數(shù)據(jù)集 214
9.4.1 MOT16數(shù)據(jù)集 214
9.4.2 PETS2016數(shù)據(jù)集 215
9.4.3 ChangeDetection.net數(shù)據(jù)集 216
9.4.4 OTCBVS紅外圖像數(shù)據(jù)集 216
9.4.5 KITTI自動(dòng)駕駛數(shù)據(jù)集 217
9.4.6 Cityscapes Dataset數(shù)據(jù)集 217
9.5 實(shí)驗(yàn):多目標(biāo)跟蹤實(shí)驗(yàn) 218
9.5.1 實(shí)驗(yàn)?zāi)康?218
9.5.2 實(shí)驗(yàn)要求 218
9.5.3 實(shí)驗(yàn)原理 218
9.5.4 實(shí)驗(yàn)步驟及實(shí)驗(yàn)結(jié)果 219
習(xí)題 222
參考文獻(xiàn) 222
第10章 語(yǔ)音識(shí)別 224
10.1 語(yǔ)音識(shí)別概述 224
10.1.1 語(yǔ)音識(shí)別的研究背景 224
10.1.2 語(yǔ)音識(shí)別的現(xiàn)狀與問題 225
10.1.3 語(yǔ)音識(shí)別系統(tǒng)的基本結(jié)構(gòu) 226
10.2 聲學(xué)模型 227
10.2.1 混合高斯模型 227
10.2.2 隱馬爾可夫模型 228
10.3 語(yǔ)言模型 229
10.3.1 語(yǔ)言模型的基礎(chǔ)理論 229
10.3.2 基于知識(shí)的語(yǔ)言模型 229
10.3.3 基于統(tǒng)計(jì)方法的語(yǔ)言模型 230
10.3.4 基于知識(shí)的語(yǔ)言模型和基于統(tǒng)計(jì)方法的語(yǔ)言模型比較 231
10.4 解碼器 232
10.5 深度學(xué)習(xí)模型 234
10.5.1 深度神經(jīng)網(wǎng)絡(luò) 234
10.5.2 DNN前向傳播算法 235
10.5.3 DNN反向傳播算法 236
10.5.4 DNN中的激活函數(shù) 236
10.6 基于MFCC的語(yǔ)音識(shí)別 237
10.6.1 MFCC特征提取 237
10.6.2 MFCC的基本原理 237
10.7 基于DNN-MFCC混合系統(tǒng)的語(yǔ)音識(shí)別 242
10.7.1 DNN和MFCC結(jié)合的原理 242
10.7.2 DNN-MFCC混合系統(tǒng) 244
10.8 實(shí)驗(yàn):基于MFCC特征和THCHS-30數(shù)據(jù)集的語(yǔ)音識(shí)別 246
10.8.1 實(shí)驗(yàn)?zāi)康?246
10.8.2 實(shí)驗(yàn)要求 246
10.8.3 實(shí)驗(yàn)原理 247
10.8.4 實(shí)驗(yàn)步驟 248
10.8.5 實(shí)驗(yàn)結(jié)果 248
習(xí)題 249
參考文獻(xiàn) 250
第11章 生物特征識(shí)別 252
11.1 生物特征識(shí)別概述 252
11.1.1 生物特征 252
11.1.2 生物特征識(shí)別系統(tǒng) 253
11.1.3 應(yīng)用概況和發(fā)展趨勢(shì) 255
11.2 指紋識(shí)別 256
11.2.1 指紋特征 257
11.2.2 指紋采集設(shè)備 258
11.2.3 指紋圖像預(yù)處理 259
11.2.4 指紋特征提取 264
11.2.5 指紋特征匹配 266
11.3 人臉識(shí)別 267
11.3.1 人臉識(shí)別概述 267
11.3.2 人臉檢測(cè) 269
11.3.3 人臉特征提取 271
11.3.4 人臉特征匹配 273
11.4 虹膜識(shí)別 274
11.4.1 虹膜識(shí)別概述 274
11.4.2 虹膜定位 275
11.4.3 虹膜圖像歸一化 277
11.4.4 虹膜特征提取 278
11.4.5 虹膜特征匹配 279
11.5 步態(tài)識(shí)別 280
11.5.1 步態(tài)識(shí)別概述 280
11.5.2 步態(tài)特征提取 281
11.5.3 步態(tài)特征匹配 282
11.6 實(shí)驗(yàn):人臉識(shí)別 283
11.6.1 實(shí)驗(yàn)?zāi)康?283
11.6.2 實(shí)驗(yàn)要求 283
11.6.3 實(shí)驗(yàn)原理 283
11.6.4 實(shí)驗(yàn)步驟 283
習(xí)題 284
參考文獻(xiàn) 285
第12章 醫(yī)學(xué)圖像檢索 287
12.1 醫(yī)學(xué)圖像檢索概述 287
12.1.1 醫(yī)學(xué)圖像的特點(diǎn) 287
12.1.2 基于內(nèi)容的醫(yī)學(xué)圖像檢索 288
12.1.3 醫(yī)學(xué)圖像檢索框架 290
12.1.4 醫(yī)學(xué)圖像檢索中的關(guān)鍵技術(shù) 292
12.2 多媒體內(nèi)容描述標(biāo)準(zhǔn)MPEG-7 292
12.2.1 MPEG-7的基本概念 293
12.2.2 MPEG-7的主要元素 293
12.2.3 MPEG-7的組成 294
12.2.4 MPEG-7視覺描述工具 295
12.3 基于MPEG-7紋理描述子的X射線胸片圖像檢索 297
12.3.1 X射線胸片圖像 297
12.3.2 基于同構(gòu)型紋理描述子的X射線胸片圖像檢索 298
12.4 圖像檢索系統(tǒng)性能評(píng)價(jià) 301
12.5 實(shí)驗(yàn):基于顏色直方圖的醫(yī)學(xué)圖像檢索 302
12.5.1 實(shí)驗(yàn)?zāi)康?302
12.5.2 實(shí)驗(yàn)要求 302
12.5.3 實(shí)驗(yàn)原理 302
12.5.4 實(shí)驗(yàn)步驟 302
12.5.5 實(shí)驗(yàn)結(jié)果 310
習(xí)題 311
參考文獻(xiàn) 312
附錄A 人工智能實(shí)驗(yàn)環(huán)境 314