機(jī)器學(xué)習(xí)原理與實(shí)戰(zhàn)
定 價(jià):59.8 元
- 作者:何偉,張良均
- 出版時(shí)間:2021/7/1
- ISBN:9787115563996
- 出 版 社:人民郵電出版社
- 中圖法分類:TP181
- 頁(yè)碼:277
- 紙張:
- 版次:01
- 開本:16開
本書以Python機(jī)器學(xué)習(xí)常用技術(shù)與真實(shí)案例相結(jié)合的方式,深入淺出地介紹了Python機(jī)器學(xué)習(xí)應(yīng)用的主要內(nèi)容。全書共11章,分別介紹了機(jī)器學(xué)習(xí)概述、數(shù)據(jù)準(zhǔn)備、特征工程、有監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)、智能推薦的相關(guān)知識(shí),并介紹了市財(cái)政收入分析案例、基于非侵入式電力負(fù)荷監(jiān)測(cè)與分解的電力分析案例、航空公司客戶價(jià)值分析案例、廣電大數(shù)據(jù)營(yíng)銷推薦案例以及基于TipDM數(shù)據(jù)挖掘建模平臺(tái)實(shí)現(xiàn)航空公司客戶價(jià)值分析案例。每章都包含了課后習(xí)題,幫助讀者鞏固所學(xué)的內(nèi)容。
本書可以作為高校數(shù)據(jù)科學(xué)或人工智能的相關(guān)專業(yè)教材,也可以作為機(jī)器學(xué)習(xí)愛好者的自學(xué)用書。
1.將Python基礎(chǔ)與機(jī)器學(xué)習(xí)常用編程庫(kù)精煉整合,幫助零基礎(chǔ)讀者更快地學(xué)會(huì)使用Python進(jìn)行機(jī)器學(xué)習(xí)。
2.以實(shí)現(xiàn)機(jī)器學(xué)習(xí)流程的各個(gè)步驟為導(dǎo)向,介紹了如何從零開始構(gòu)建機(jī)器學(xué)習(xí)應(yīng)用所需的必備技能
3.設(shè)計(jì)思路以應(yīng)用為導(dǎo)向,讓讀者明確如何利用所學(xué)知識(shí)來解決問題,通過課后練習(xí)鞏固所學(xué)知識(shí),使讀者真正理解并能夠應(yīng)用所學(xué)知識(shí)
4.提供PPT課件、教學(xué)大綱、教學(xué)進(jìn)度表等教學(xué)資源
何偉,閩江學(xué)院,男,中共黨員,1982年出生,工學(xué)博士,副教授,碩士生導(dǎo)師,閩都學(xué)者拔尖人才,香港理工訪問學(xué)者,入選福建省高校杰出青年科研人才培育計(jì)劃。
主要研究領(lǐng)域:智能系統(tǒng)與信息融合、船海裝備與新能源。近三年,承擔(dān)了《系統(tǒng)工程》、《大數(shù)據(jù)分析與應(yīng)用》《智能交通系統(tǒng)創(chuàng)新》、《物流技術(shù)與設(shè)備》等課程教學(xué)任務(wù),先后在國(guó)內(nèi)外發(fā)表學(xué)術(shù)論文30余篇,其中SCI、EI等檢索收錄論文20余篇;主持和參與國(guó)家自然科學(xué)基金、省自然科學(xué)基金項(xiàng)目等省部級(jí)以上項(xiàng)目十余項(xiàng);獲得福建省教學(xué)成果特等獎(jiǎng)、福建省科技進(jìn)步二等獎(jiǎng)、中國(guó)航海學(xué)會(huì)科學(xué)技術(shù)一等獎(jiǎng)等多項(xiàng)省部級(jí)獎(jiǎng)項(xiàng),F(xiàn)兼任福建省創(chuàng)新創(chuàng)業(yè)創(chuàng)造教育指導(dǎo)委員會(huì)委員,中國(guó)智能交通協(xié)會(huì)水路交通專業(yè)委員會(huì)委員,福建省船舶與海洋工程學(xué)會(huì)委員。
張良均 高級(jí)信息系統(tǒng)項(xiàng)目管理師,泰迪杯全國(guó)大學(xué)生數(shù)據(jù)挖掘競(jìng)賽的發(fā)起人。華南師范大學(xué)、廣東工業(yè)大學(xué)兼職教授,廣東省工業(yè)與應(yīng)用數(shù)學(xué)學(xué)會(huì)理事。兼有大型高科技企業(yè)和高校的工作經(jīng)歷,主要從事大數(shù)據(jù)挖掘及其應(yīng)用的策劃、研發(fā)及咨詢培訓(xùn)。全國(guó)計(jì)算機(jī)技術(shù)與軟件專業(yè)技術(shù)資格(水平)考試?yán)^續(xù)教育和CDA數(shù)據(jù)分析師培訓(xùn)講師。發(fā)表數(shù)據(jù)挖掘相關(guān)論文數(shù)二十余篇,已取得國(guó)家發(fā)明專利12項(xiàng),主編圖書《神經(jīng)網(wǎng)絡(luò)實(shí)用教程》、《數(shù)據(jù)挖掘:實(shí)用案例分析》、《MATLAB數(shù)據(jù)分析與挖掘?qū)崙?zhàn)》等9本暢銷圖書,主持并完成科技項(xiàng)目9項(xiàng)。獲得SAS、SPSS數(shù)據(jù)挖掘認(rèn)證及Hadoop開發(fā)工程師證書,具有電力、電信、銀行、制造企業(yè)、電子商務(wù)和電子政務(wù)的項(xiàng)目經(jīng)驗(yàn)和行業(yè)背景。
第 1章 機(jī)器學(xué)習(xí)概述 1
1.1 機(jī)器學(xué)習(xí)簡(jiǎn)介 1
1.1.1 機(jī)器學(xué)習(xí)的概念 1
1.1.2 機(jī)器學(xué)習(xí)的應(yīng)用領(lǐng)域 1
1.2 機(jī)器學(xué)習(xí)通用流程 3
1.2.1 目標(biāo)分析 4
1.2.2 數(shù)據(jù)準(zhǔn)備 5
1.2.3 特征工程 6
1.2.4 模型訓(xùn)練 7
1.2.5 性能度量與模型調(diào)優(yōu) 7
1.3 Python機(jī)器學(xué)習(xí)工具庫(kù)簡(jiǎn)介 7
1.3.1 數(shù)據(jù)準(zhǔn)備相關(guān)工具庫(kù) 8
1.3.2 數(shù)據(jù)可視化相關(guān)工具庫(kù) 8
1.3.3 模型訓(xùn)練與評(píng)估相關(guān)工具庫(kù) 9
小結(jié) 10
課后習(xí)題 10
第 2章 數(shù)據(jù)準(zhǔn)備 13
2.1 數(shù)據(jù)質(zhì)量校驗(yàn) 13
2.1.1 一致性校驗(yàn) 13
2.1.2 缺失值校驗(yàn) 16
2.1.3 異常值分析 17
2.2 數(shù)據(jù)分布與趨勢(shì)探查 18
2.2.1 分布分析 18
2.2.2 對(duì)比分析 22
2.2.3 描述性統(tǒng)計(jì)分析 26
2.2.4 周期性分析 28
2.2.5 貢獻(xiàn)度分析 30
2.2.6 相關(guān)性分析 31
2.3 數(shù)據(jù)清洗 35
2.3.1 缺失值處理 35
2.3.2 異常值處理 39
2.4 數(shù)據(jù)合并 39
2.4.1 數(shù)據(jù)堆疊 40
2.4.2 主鍵合并 43
小結(jié) 45
課后習(xí)題 45
第3章 特征工程 48
3.1 特征變換 48
3.1.1 特征縮放 48
3.1.2 獨(dú)熱編碼 52
3.1.3 離散化 53
3.2 特征選擇 56
3.2.1 過濾式選擇 57
3.2.2 包裹式選擇 58
3.2.3 嵌入式選擇 58
3.2.4 字典學(xué)習(xí) 59
小結(jié) 64
課后習(xí)題 64
第4章 有監(jiān)督學(xué)習(xí) 67
4.1 有監(jiān)督學(xué)習(xí)簡(jiǎn)介 67
4.2 性能度量 67
4.2.1 分類任務(wù)性能度量 68
4.2.2 回歸任務(wù)性能度量 70
4.3 線性模型 70
4.3.1 線性模型簡(jiǎn)介 70
4.3.2 線性回歸 70
4.3.3 邏輯回歸 73
4.4 k近鄰分類 76
4.5 決策樹 78
4.5.1 決策樹簡(jiǎn)介 78
4.5.2 ID3算法 79
4.5.3 C4.5算法 81
4.5.4 CART算法 84
4.6 支持向量機(jī) 86
4.6.1 支持向量機(jī)簡(jiǎn)介 86
4.6.2 線性支持向量機(jī) 87
4.6.3 非線性支持向量機(jī) 91
4.7 樸素貝葉斯 94
4.8 神經(jīng)網(wǎng)絡(luò) 98
4.8.1 神經(jīng)網(wǎng)絡(luò)介紹 98
4.8.2 BP神經(jīng)網(wǎng)絡(luò) 99
4.9 集成學(xué)習(xí) 103
4.9.1 Bagging 104
4.9.2 Boosting 106
4.9.3 Stacking 109
小結(jié) 111
課后習(xí)題 111
第5章 無(wú)監(jiān)督學(xué)習(xí) 113
5.1 無(wú)監(jiān)督學(xué)習(xí)簡(jiǎn)介 113
5.2 降維 113
5.2.1 PCA 114
5.2.2 核化線性降維 116
5.3 聚類任務(wù) 119
5.3.1 性能度量 119
5.3.2 距離計(jì)算 120
5.3.3 原型聚類 121
5.3.4 密度聚類 128
5.3.5 層次聚類 131
小結(jié) 133
課后習(xí)題 133
第6章 智能推薦 135
6.1 智能推薦簡(jiǎn)介 135
6.1.1 什么是推薦系統(tǒng) 135
6.1.2 智能推薦的應(yīng)用 135
6.2 智能推薦性能度量 137
6.2.1 離線實(shí)驗(yàn)評(píng)價(jià)指標(biāo) 137
6.2.2 用戶調(diào)查評(píng)價(jià)指標(biāo) 139
6.2.3 在線實(shí)驗(yàn)評(píng)價(jià)指標(biāo) 140
6.3 基于關(guān)聯(lián)規(guī)則的智能推薦 140
6.3.1 關(guān)聯(lián)規(guī)則和頻繁項(xiàng)集 140
6.3.2 Apriori 141
6.3.3 FP-Growth 145
6.4 基于協(xié)同過濾的智能推薦 150
6.4.1 基于用戶的協(xié)同過濾 150
6.4.2 基于物品的協(xié)同過濾 153
小結(jié) 157
課后習(xí)題 157
第7章 市財(cái)政收入分析 160
7.1 目標(biāo)分析 160
7.1.1 背景 160
7.1.2 數(shù)據(jù)說明 160
7.1.3 分析目標(biāo) 161
7.2 數(shù)據(jù)準(zhǔn)備 162
7.3 特征工程 164
7.3.1 Lasso回歸 164
7.3.2 特征選擇 164
7.4 模型訓(xùn)練 165
7.4.1 灰色預(yù)測(cè)模型 165
7.4.2 關(guān)鍵特征預(yù)測(cè) 166
7.4.3 SVR模型預(yù)測(cè) 168
7.5 性能度量 169
小結(jié) 171
課后習(xí)題 171
第8章 基于非侵入式電力負(fù)荷監(jiān)測(cè)與分解的電力分析 172
8.1 目標(biāo)分析 172
8.1.1 背景 172
8.1.2 數(shù)據(jù)說明 173
8.1.3 分析目標(biāo) 175
8.2 數(shù)據(jù)準(zhǔn)備 176
8.2.1 數(shù)據(jù)探索 176
8.2.2 缺失值處理 179
8.3 特征工程 181
8.3.1 設(shè)備數(shù)據(jù) 181
8.3.2 周波數(shù)據(jù) 182
8.4 模型訓(xùn)練 183
8.5 性能度量 185
小結(jié) 189
課后習(xí)題 189
第9章 航空公司客戶價(jià)值分析 190
9.1 目標(biāo)分析 190
9.1.1 背景 190
9.1.2 數(shù)據(jù)說明 191
9.1.3 分析目標(biāo) 192
9.2 數(shù)據(jù)準(zhǔn)備 192
9.2.1 數(shù)據(jù)探索 192
9.2.2 數(shù)據(jù)清洗 193
9.3 特征工程 193
9.3.1 特征構(gòu)造 193
9.3.2 特征選擇 195
9.3.3 特征變換 196
9.4 模型訓(xùn)練 198
9.5 性能度量 199
9.5.1 結(jié)果分析 199
9.5.2 客戶價(jià)值分析 201
小結(jié) 202
課后習(xí)題 202
第 10章 廣電大數(shù)據(jù)營(yíng)銷推薦 205
10.1 目標(biāo)分析 205
10.1.1 背景 205
10.1.2 數(shù)據(jù)說明 206
10.1.3 分析目標(biāo) 208
10.2 數(shù)據(jù)準(zhǔn)備 209
10.2.1 數(shù)據(jù)獲取 209
10.2.2 數(shù)據(jù)清洗 209
10.2.3 數(shù)據(jù)探索分析 216
10.3 特征工程 222
10.3.1 特征構(gòu)造 222
10.3.2 節(jié)目信息的獲取 244
10.4 模型構(gòu)建 247
10.4.1 基于物品的協(xié)同過濾算法的推薦模型 248
10.4.2 基于Simple TagBased TF-IDF算法的標(biāo)簽推薦模型 250
10.4.3 Popular流行度推薦模型 254
10.5 性能度量 255
10.6 結(jié)果分析 258
小結(jié) 258
課后習(xí)題 259
第 11章 基于TipDM數(shù)據(jù)挖掘建模平臺(tái)實(shí)現(xiàn)航空公司客戶價(jià)值分析 260
11.1 平臺(tái)簡(jiǎn)介 260
11.1.1 首頁(yè) 261
11.1.2 數(shù)據(jù)源 261
11.1.3 工程 263
11.1.4 系統(tǒng)組件 263
11.1.5 TipDM數(shù)據(jù)挖掘建模平臺(tái)的本地化部署 264
11.2 快速構(gòu)建航空公司客戶價(jià)值分析工程 267
11.2.1 數(shù)據(jù)獲取 267
11.2.2 數(shù)據(jù)準(zhǔn)備 270
11.2.3 特征工程 273
11.2.4 模型訓(xùn)練 275
小結(jié) 277
課后習(xí)題 277
參考文獻(xiàn) 278