機(jī)器學(xué)習(xí)入門與實(shí)戰(zhàn)(微課版)
定 價:38 元
- 作者:王志
- 出版時間:2023/2/1
- ISBN:9787121448607
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP181
- 頁碼:184
- 紙張:
- 版次:01
- 開本:16開
本書以掌握Python語言基礎(chǔ)為前提,由淺入深、全面系統(tǒng)地講解了機(jī)器學(xué)習(xí)的相關(guān)知識及技能,內(nèi)容注重實(shí)用性和可操作性,在介紹機(jī)器學(xué)習(xí)理論知識的基礎(chǔ)上,結(jié)合具體的實(shí)戰(zhàn)實(shí)例,給出了詳細(xì)的代碼及實(shí)現(xiàn)步驟。全書共9個項(xiàng)目,分別介紹了數(shù)據(jù)分析基礎(chǔ)、機(jī)器學(xué)習(xí)項(xiàng)目實(shí)戰(zhàn)流程、探索性數(shù)據(jù)分析與特征工程、常見機(jī)器學(xué)習(xí)算法及框架、交叉驗(yàn)證與超參數(shù)調(diào)優(yōu),并結(jié)合主流機(jī)器學(xué)習(xí)技術(shù)框架Scikit-learn,展開了信用違約分類預(yù)測、社交媒體評論分類預(yù)測、共享單車用量需求回歸預(yù)測、信用卡客戶忠誠度回歸預(yù)測的項(xiàng)目實(shí)戰(zhàn)。
王志(1986.8—),博士,現(xiàn)任浙江省金融職業(yè)學(xué)院人工智能技術(shù)服務(wù)專業(yè)負(fù)責(zé)人,專業(yè)教研室副主任,人工智能領(lǐng)域技術(shù)多年創(chuàng)業(yè)經(jīng)歷,具備豐富的機(jī)器學(xué)習(xí)工業(yè)實(shí)戰(zhàn)及培訓(xùn)經(jīng)驗(yàn),曾獲得銀監(jiān)會"機(jī)器學(xué)習(xí)在中小銀行應(yīng)用”科技項(xiàng)目三等獎。參與編寫《人工智能導(dǎo)論》教材,入選十三五規(guī)劃教材。
項(xiàng)目1 數(shù)據(jù)分析基礎(chǔ) 1
任務(wù)1 開發(fā)環(huán)境的搭建 1
1.1.1 數(shù)據(jù)分析相關(guān)庫 1
1.1.2 Anaconda的安裝和使用 2
1.1.3 Jupyter Notebook的使用 3
任務(wù)2 NumPy的應(yīng)用 4
1.2.1 數(shù)組對象的創(chuàng)建 4
1.2.2 數(shù)組的索引和切片 10
任務(wù)3 Pandas的應(yīng)用 14
1.3.1 Series對象的創(chuàng)建 14
1.3.2 Series對象的索引和切片 15
1.3.3 Series對象的常用屬性 17
任務(wù)4 數(shù)據(jù)可視化 17
1.4.1 安裝和導(dǎo)入 18
1.4.2 繪圖的流程 18
任務(wù)5 Pandas、NumPy庫的數(shù)據(jù)操作 18
1.5.1 數(shù)據(jù)讀入 18
1.5.2 數(shù)據(jù)選擇 19
1.5.3 缺失值填充 20
1.5.4 數(shù)據(jù)透視表繪制 21
1.5.5 數(shù)據(jù)集合并 21
1.5.6 獨(dú)熱編碼 23
項(xiàng)目2 機(jī)器學(xué)習(xí)項(xiàng)目實(shí)戰(zhàn)流程 25
任務(wù)1 知識準(zhǔn)備 26
2.1.1 問題定義 26
2.1.2 數(shù)據(jù)準(zhǔn)備 27
2.1.3 模型訓(xùn)練 30
2.1.4 模型評估 34
2.1.5 模型部署 38
2.1.6 模型監(jiān)控與更新 39
2.1.7 小結(jié) 40
任務(wù)2 使用Scikit-learn框架完成基本的機(jī)器學(xué)習(xí)項(xiàng)目 40
2.2.1 Estimator 40
2.2.2 Metrics 41
2.2.3 小結(jié) 41
任務(wù)3 實(shí)戰(zhàn):泰坦尼克號事件生存預(yù)測 42
2.3.1 問題定義 42
2.3.2 數(shù)據(jù)準(zhǔn)備 42
2.3.3 模型訓(xùn)練 45
2.3.4 模型評估 46
2.3.5 小結(jié) 47
項(xiàng)目3 探索性數(shù)據(jù)分析與特征工程 48
任務(wù)1 知識準(zhǔn)備 49
3.1.1 探索性數(shù)據(jù)分析 49
3.1.2 特征工程 56
3.1.3 特征抽取 58
3.1.4 特征轉(zhuǎn)換 61
3.1.5 特征選擇 67
3.1.6 小結(jié) 67
任務(wù)2 實(shí)戰(zhàn):基于決策樹的泰坦尼克號事件生存預(yù)測 68
3.2.1 問題定義 68
3.2.2 數(shù)據(jù)準(zhǔn)備 68
3.2.3 模型訓(xùn)練 77
3.2.4 模型評估 77
3.2.5 數(shù)據(jù)保存 78
3.2.6 小結(jié) 78
項(xiàng)目4 常見機(jī)器學(xué)習(xí)算法及框架 79
任務(wù)1 知識準(zhǔn)備 79
4.1.1 損失函數(shù)、代價函數(shù)與目標(biāo)函數(shù) 79
4.1.2 邏輯回歸與神經(jīng)網(wǎng)絡(luò) 81
4.1.3 決策樹與隨機(jī)森林 84
任務(wù)2 基于集成學(xué)習(xí)思想的算法 85
任務(wù)3 Python環(huán)境下XGBoost的安裝及使用 88
任務(wù)4 Python環(huán)境下LightGBM的安裝及使用 89
項(xiàng)目5 交叉驗(yàn)證與超參數(shù)調(diào)優(yōu) 91
任務(wù)1 知識準(zhǔn)備 92
5.1.1 機(jī)器學(xué)習(xí)算法中的參數(shù)與超參數(shù) 92
5.1.2 超參數(shù)調(diào)優(yōu)方法 92
5.1.3 GBM算法的超參數(shù)調(diào)優(yōu) 97
任務(wù)2 隨機(jī)森林超參數(shù)調(diào)優(yōu) 99
5.2.1 RF框架的參數(shù)意義 99
5.2.2 RF決策樹的參數(shù)含義 100
任務(wù)3 實(shí)戰(zhàn):GBM算法超參數(shù)調(diào)優(yōu) 101
5.3.1 問題定義 101
5.3.2 數(shù)據(jù)準(zhǔn)備 101
5.3.3 小結(jié) 107
項(xiàng)目6 信用違約分類預(yù)測 109
任務(wù)1 信用違約分類建模 109
6.1.1 問題定義 109
6.1.2 數(shù)據(jù)準(zhǔn)備 110
6.1.3 模型訓(xùn)練 114
6.1.4 模型評估 115
6.1.5 小結(jié) 116
任務(wù)2 實(shí)戰(zhàn):處理不平衡樣本來優(yōu)化模型 116
6.2.1 數(shù)據(jù)準(zhǔn)備 116
6.2.2 小結(jié) 119
項(xiàng)目7 社交媒體評論分類預(yù)測 120
任務(wù)1 社交媒體評論分類建模 120
7.1.1 問題定義 120
7.1.2 數(shù)據(jù)準(zhǔn)備 121
7.1.3 模型訓(xùn)練 125
7.1.4 模型評估 126
7.1.5 小結(jié) 126
任務(wù)2 實(shí)戰(zhàn):使用不同文本特征提取方法來優(yōu)化模型 127
7.2.1 問題定義 127
7.2.2 數(shù)據(jù)準(zhǔn)備 127
7.2.3 基于TF-IDF特征的模型訓(xùn)練與評估 130
7.2.4 TSNE、LDA降維操作及TSNE可視化 131
7.2.5 基于LDA方法對TF-IDF特征降維處理后的模型訓(xùn)練與評估 132
7.2.6 基于詞向量方法的模型訓(xùn)練與評估 133
7.2.7 小結(jié) 135
項(xiàng)目8 共享單車用量需求回歸預(yù)測 136
任務(wù)1 共享單車用量需求回歸建模 136
8.1.1 問題定義 136
8.1.2 數(shù)據(jù)準(zhǔn)備 137
8.1.3 模型訓(xùn)練 143
8.1.4 模型評估 143
8.1.5 小結(jié) 144
任務(wù)2 實(shí)戰(zhàn):使用特征選擇及離散化方法來優(yōu)化模型 144
8.2.1 問題定義 144
8.2.2 數(shù)據(jù)準(zhǔn)備 145
8.2.3 模型訓(xùn)練 148
8.2.4 模型評估 149
8.2.5 小結(jié) 149
項(xiàng)目9 信用卡客戶忠誠度回歸預(yù)測 150
任務(wù)1 信用卡客戶忠誠度回歸建模 150
9.1.1 問題定義 150
9.1.2 數(shù)據(jù)準(zhǔn)備 151
9.1.3 模型訓(xùn)練 160
9.1.4 模型評估 160
9.1.5 小結(jié) 162
任務(wù)2 實(shí)戰(zhàn):增加數(shù)據(jù)源抽取特征來優(yōu)化模型 162
9.2.1 問題定義 162
9.2.2 數(shù)據(jù)準(zhǔn)備 162
9.2.3 模型訓(xùn)練 167
9.2.4 模型評估 167
9.2.5 小結(jié) 168
附錄A 課后習(xí)題及參考答案 169
項(xiàng)目1 習(xí)題及參考答案 169
項(xiàng)目2 習(xí)題及參考答案 170
項(xiàng)目3 習(xí)題及參考答案 171
項(xiàng)目4 習(xí)題及參考答案 172
項(xiàng)目5 習(xí)題及參考答案 173
項(xiàng)目6 習(xí)題及參考答案 174
項(xiàng)目7 習(xí)題及參考答案 174
項(xiàng)目8 習(xí)題及參考答案 175
項(xiàng)目9 習(xí)題及參考答案 176