本書以項目實踐作為主線,結合必需的理論知識,以任務的形式進行內容設計,每個任務都包含任務描述及任務實施的步驟,讀者按照實施步驟進行操作就可以完成相應的學習任務,從而不斷提升項目實踐能力。本書主要內容涉及機器學習的基礎知識,模型評估與選擇,回歸、分類、聚類等機器學習算法,數據挖掘的基礎知識,數據分析與應用,以及通過用戶行為分析預測項目學習如何將機器學習與數據挖掘應用到實際中。
本書適合使用機器學習與數據挖掘技術進行大數據處理的程序員、架構師和產品經理作為技術參考和培訓資料,也可作為高校本科生和研究生的教材。
1.本書以項目實踐為主線,結合必需的理論知識,通過任務的形式進行內容設計,幫助讀者在實際操作中不斷提升項目實踐能力。
2.本書內容涵蓋了機器學習的基礎知識、模型評估與選擇、回歸、分類、聚類等算法,以及數據挖掘的基礎知識、數據分析與應用,為讀者提供全面的技術指導。
3.本書通過用戶行為分析預測項目,展示了如何將機器學習與數據挖掘應用到實際中,幫助讀者更好地理解和應用相關技術。
4.難易適中,案例式教學,注重全面培養(yǎng)讀者的數據意識、數據思維和數據能力,融合課程思政元素,提供豐富教學資源。
王璐烽,教授,世界技能大賽中國賽區(qū)裁判員、重慶市高校黃大年式教師團隊負責人、重慶市高校中青年骨干教師、重慶市高校優(yōu)秀思想政治工作者;撰寫論文20余篇,其中SCI/EI收錄或核心期刊10余篇;主編國家十三五規(guī)劃教材1本,其余4本;主持重慶市重大教改課題1項,重點1項,其余5項;主持重慶市重大科技項目1項;主持重慶市精品在線課程1門;獲得全國職業(yè)院校信息化教學大賽一等獎,重慶市科技進步三等獎,中國通信工業(yè)協會教學成果特等獎;指導學生參加全國職業(yè)院校技能大賽獲一等獎、二等獎各1次;參與教育部專業(yè)標準、1+X職業(yè)技能等級標準、重慶市人社局新職業(yè)(人工智能訓練師)培訓標準、考核標準等研制工作。
項目1 初識機器學習 1
任務1 學習機器學習的理論 2
【任務描述】 2
【任務目標】 2
【知識鏈接】 2
【任務實施】 3
任務2 軟件的安裝與使用 8
【任務描述】 8
【任務目標】 8
【知識鏈接】 8
【任務實施】 9
項目小結 16
思考與練習 17
項目2 模型評估與選擇 19
任務1 學習過擬合與欠擬合 20
【任務描述】 20
【任務目標】 20
【知識鏈接】 20
【任務實施】 24
任務2 學習評估方法 25
【任務描述】 25
【任務目標】 26
【知識鏈接】 26
【任務實施】 27
任務3 學習性能度量與檢驗 29
【任務描述】 29
【任務目標】 29
【知識鏈接】 30
【任務實施】 38
項目小結 39
項目拓展 40
思考與練習 41
項目3 回歸算法與應用 43
任務1 學習回歸預測問題 44
【任務描述】 44
【任務目標】 44
【知識鏈接】 44
【任務實施】 45
任務2 學習線性回歸 46
【任務描述】 46
【任務目標】 46
【知識鏈接】 46
【任務實施】 48
任務3 學習Lasso回歸 52
【任務描述】 52
【任務目標】 52
【知識鏈接】 52
【任務實施】 53
任務4 學習神經網絡 55
【任務描述】 55
【任務目標】 55
【知識鏈接】 55
【任務實施】 57
任務5 學習邏輯斯諦回歸 59
【任務描述】 59
【任務目標】 59
【知識鏈接】 59
【任務實施】 60
項目小結 63
項目拓展 64
思考與練習 64
項目4 分類算法與應用 66
任務1 學習分類問題 67
【任務描述】 67
【任務目標】 67
【知識鏈接】 67
【任務實施】 67
任務2 學習支持向量機 69
【任務描述】 69
【任務目標】 69
【知識鏈接】 69
【任務實施】 71
任務3 學習樸素貝葉斯分類 74
【任務描述】 74
【任務目標】 74
【知識鏈接】 74
【任務實施】 75
任務4 學習kNN算法 77
【任務描述】 77
【任務目標】 77
【知識鏈接】 78
【任務實施】 79
任務5 學習決策樹 84
【任務描述】 84
【任務目標】 84
【知識鏈接】 85
【任務實施】 86
項目小結 87
項目拓展 88
思考與練習 88
項目5 聚類算法與應用 90
任務1 學習聚類問題 91
【任務描述】 91
【任務目標】 91
【知識鏈接】 91
【任務實施】 91
任務2 學習K-means聚類 92
【任務描述】 92
【任務目標】 92
【知識鏈接】 92
【任務實施】 93
任務3 學習密度聚類 95
【任務描述】 95
【任務目標】 95
【知識鏈接】 95
【任務實施】 96
任務4 學習層次聚類 98
【任務描述】 98
【任務目標】 98
【知識鏈接】 99
【任務實施】 100
任務5 學習主成分分析 102
【任務描述】 102
【任務目標】 102
【知識鏈接】 102
【任務實施】 103
任務6 進行聚類效果評測 105
【任務描述】 105
【任務目標】 105
【知識鏈接】 105
【任務實施】 106
項目小結 109
項目拓展 110
思考與練習 110
項目6 機器學習應用 112
任務1 學習MNIST數字分類 113
【任務描述】 113
【任務目標】 113
【知識鏈接】 113
【任務實施】 113
任務2 學習泰坦尼克號生存計劃 118
【任務描述】 118
【任務目標】 119
【任務實施】 119
任務3 進行房價預測 127
【任務描述】 127
【任務目標】 127
【任務實施】 127
項目小結 136
項目拓展 136
思考與練習 136
項目7 數據挖掘 138
任務1 學習數據挖掘的概念 139
【任務描述】 139
【任務目標】 139
【知識鏈接】 139
【任務實施】 139
任務2 學習數據挖掘的應用 142
【任務描述】 142
【任務目標】 142
【知識鏈接】 142
【任務實施】 143
任務3 學習數據挖掘的模型 147
【任務描述】 147
【任務目標】 148
【知識鏈接】 148
【任務實施】 148
項目小結 156
項目拓展 156
思考與練習 156
項目8 數據分析與應用 158
任務1 學習數據分析的概念 159
【任務描述】 159
【任務目標】 159
【任務實施】 159
任務2 學習關聯規(guī)則算法及
應用 161
【任務描述】 161
【任務目標】 161
【知識鏈接】 162
【任務實施】 163
任務3 進行銀行信貸預測 165
【任務描述】 165
【任務目標】 165
【任務實施】 166
任務4 使用WEKA軟件進行
房屋定價 171
【任務描述】 171
【任務目標】 172
【知識鏈接】 172
【任務實施】 172
項目小結 179
項目拓展 179
思考與練習 180
項目9 淘寶用戶行為分析預測 181
【項目描述】 182
【項目目標】 182
【知識鏈接】 182
【項目實施】 183
項目小結 189
項目拓展 190
思考與練習 190
參考文獻 191