機(jī)器學(xué)習(xí)案例驅(qū)動教程
定 價:49 元
- 作者:張霞
- 出版時間:2021/6/1
- ISBN:9787121411038
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP181
- 頁碼:260
- 紙張:
- 版次:01
- 開本:16開
本書在不涉及大量數(shù)學(xué)模型與復(fù)雜算法實現(xiàn)的前提下,從機(jī)器學(xué)習(xí)概述開始,由“泰坦尼克號數(shù)據(jù)分析與預(yù)處理”“良/惡性乳腺癌腫瘤預(yù)測”“波士頓房價預(yù)測”“手寫體數(shù)字聚類”“人臉特征降維”“在線旅行社酒店價格異常檢測”6個案例分別引入數(shù)據(jù)分析、分類、回歸、聚類、特征降維和異常檢測的應(yīng)用開發(fā)實戰(zhàn)技術(shù)及其少量理論,能夠幫助讀者以最快的速度掌握使用Scikit-learn庫進(jìn)行機(jī)器學(xué)習(xí)開發(fā)的實戰(zhàn)技能。書末是學(xué)習(xí)機(jī)器學(xué)習(xí)時可能用到的附錄。本書適合對機(jī)器學(xué)習(xí)感興趣的初學(xué)者、需要快速入門機(jī)器學(xué)習(xí)的高職相關(guān)專業(yè)學(xué)生,以及期望快速進(jìn)入機(jī)器學(xué)習(xí)任務(wù)的研發(fā)工程技術(shù)人員。
張霞,南京航空航天大學(xué)博士,現(xiàn)任南京信息職業(yè)技術(shù)學(xué)院人工智能學(xué)院人工智能技術(shù)服務(wù)教研室主任,2019年江蘇省高校青藍(lán)工程優(yōu)秀青年骨干教師培養(yǎng)對象,江蘇省人工智能學(xué)會人工智能教育專業(yè)委員會委員,主要研究人工智能技術(shù)服務(wù)及信息職業(yè)教育。發(fā)表SCI論文2篇,EI論文1篇,中文核心論文2篇,主持中國電子教育學(xué)會課題1項獲一等獎,主持橫向課題2項,主持校社科課題1項,參與橫向課題3項,參與國家骨干院校重點(diǎn)建設(shè)專業(yè)等。
緒論 1
0.1 機(jī)器學(xué)習(xí)綜述 1
0.1.1 機(jī)器學(xué)習(xí)的含義 1
0.1.2 機(jī)器學(xué)習(xí)的應(yīng)用場景 1
0.1.3 機(jī)器學(xué)習(xí)類型 3
0.1.4 相關(guān)術(shù)語 5
0.1.5 人工智能、機(jī)器學(xué)習(xí)與深度學(xué)習(xí) 6
0.2 開發(fā)環(huán)境搭建 8
0.2.1 Windows系統(tǒng)環(huán)境 8
0.2.2 Ubuntu系統(tǒng)環(huán)境 17
0.3 Python編程基礎(chǔ) 17
0.3.1 Python簡介 17
0.3.2 Python基本語法 18
0.3.3 Python數(shù)據(jù)類型 19
0.3.4 Python常用語句 28
0.3.5 Python函數(shù)(模塊)設(shè)計 33
0.3.6 Python編程庫(包)的導(dǎo)入 38
案例1 泰坦尼克號數(shù)據(jù)分析與預(yù)處理 39
1.1 案例描述及實現(xiàn) 39
1.2 案例詳解及示例 43
1.3 支撐技術(shù) 45
1.3.1 Numpy 45
1.3.2 Matplotlib 52
1.3.3 Pandas 61
1.3.4 Scikit-learn 64
案例2 良/惡性乳腺癌腫瘤預(yù)測 66
2.1 案例描述及實現(xiàn) 66
2.2 案例詳解及示例 69
2.2.1 數(shù)據(jù)預(yù)處理 69
2.2.2 linear_model 71
2.2.3 KNeighborsClassifier 74
2.2.4 SVM 76
2.2.5 naive_bayes 80
2.2.6 DecisionTreeClassifier 82
2.2.7 ensemble 85
2.2.8 classification_report 87
2.3 支撐知識 88
2.3.1 分類任務(wù)簡介 88
2.3.2 線性模型 88
2.3.3 K近鄰分類 90
2.3.4 支持向量機(jī) 91
2.3.5 樸素貝葉斯 93
2.3.6 決策樹 95
2.3.7 集成模型 96
2.3.8 神經(jīng)網(wǎng)絡(luò) 97
案例3 波士頓房價預(yù)測 98
3.1 案例描述及實現(xiàn) 98
3.2 案例詳解及示例 102
3.2.1 數(shù)據(jù)預(yù)處理 102
3.2.2 linear_model 104
3.2.3 KNeighborsRegressor 108
3.2.4 SVR 110
3.2.5 DecisionTreeRegressor 111
3.2.6 ensemble 113
3.3 支撐知識 119
3.3.1 回歸任務(wù)簡介 119
3.3.2 線性回歸 120
3.3.3 K近鄰回歸 121
3.3.4 支持向量機(jī)回歸 122
3.3.5 決策樹回歸 122
3.3.6 集成模型回歸 124
案例4 手寫體數(shù)字聚類 125
4.1 案例描述及實現(xiàn) 125
4.1.1 案例簡介 125
4.1.2 數(shù)據(jù)介紹 125
4.1.3 案例實現(xiàn) 126
4.2 案例詳解及示例 129
4.2.1 load_digits 129
4.2.2 AgglomerativeClustering 130
4.2.3 KMeans 131
4.2.4 MeanShift 133
4.2.5 DBSCAN 134
4.2.6 AffinityPropagation 136
4.2.7 v_measure_score 137
4.3 支撐知識 140
4.3.1 聚類任務(wù)簡介 140
4.3.2 層次聚類 140
4.3.3 K均值聚類 141
4.3.4 均值漂移聚類 143
4.3.5 密度聚類 143
4.3.6 近鄰傳播聚類 144
案例5 人臉特征降維 145
5.1 案例描述 145
5.1.1 案例簡介 145
5.1.2 數(shù)據(jù)介紹 145
5.1.3 案例實現(xiàn) 145
5.2 案例詳解及示例 148
5.2.1 fetch_olivetti_faces 148
5.2.2 PCA 149
5.2.3 NMF 155
5.2.4 FastICA 156
5.2.5 FactorAnalysis 157
5.3 支撐知識及示例 158
5.3.1 特征降維簡介 158
5.3.2 主成分分析 158
5.3.3 非負(fù)矩陣分解 159
5.3.4 獨(dú)立成分分析 160
5.3.5 因子分析 161
案例6 在線旅行社酒店價格異常檢測 162
6.1 案例描述 162
6.1.1 案例簡介 162
6.1.2 數(shù)據(jù)介紹 162
6.1.3 案例實現(xiàn) 163
6.2 案例詳解及示例 168
6.2.1 導(dǎo)入數(shù)據(jù) 168
6.2.2 基于聚類的異常檢測 168
6.2.3 基于孤立森林的異常檢測 169
6.2.4 基于支持向量機(jī)的異常檢測 172
6.2.5 基于高斯分布的異常檢測 173
6.3 支撐知識 177
6.3.1 異常檢測簡介 177
6.3.2 基于聚類的異常檢測 177
6.3.3 基于孤立森林的異常檢測 177
6.3.4 基于支持向量機(jī)的異常檢測 179
6.3.5 基于高斯分布的異常檢測 179
附錄A VirtualBox虛擬機(jī)軟件與Linux的安裝和配置 180
附錄B Linux(Ubuntu 14.4)的基本命令與使用 203
附錄C GitHub代碼托管平臺 208
附錄D Docker技術(shù)與應(yīng)用 212
附錄E 人工智能的數(shù)學(xué)基礎(chǔ)與工具 214
附錄F 公開數(shù)據(jù)集介紹與下載 225
附錄G 人工智能的網(wǎng)絡(luò)學(xué)習(xí)資源 230
附錄H 人工智能的技術(shù)圖譜 233
附錄I 人工智能技術(shù)應(yīng)用就業(yè)崗位與技能需求 237
附錄J Sklearn常用模塊和函數(shù) 242
參考文獻(xiàn) 248