本書分為理論篇、工具篇和實訓篇。理論篇主要介紹數據挖掘的基礎知識、基本任務和常用方法,側重培養(yǎng)學生對于數據挖掘基本概念等理論知識的正確理解;工具篇主要介紹PMT這一的數據挖掘工具,通過功能簡介、分類預測認知實驗等內容,側重培養(yǎng)學生對于數據挖掘基本操作的準確認知;實訓篇主要介紹了七個來自實際企業(yè)需求的大數據挖掘案例,側重培養(yǎng)學生對于數據挖掘解決實際問題的應用。本書結構嚴密、內容較新,敘述清晰,強調實踐,可作為各類職業(yè)院校大數據類課程的教材,也可作為企業(yè)大數據分析的培訓教材,還可作為企事業(yè)單位企業(yè)管理、電子商務、市場營銷、國際貿易等相關從業(yè)人員的參考用書。
理 論 篇
第1章 數據挖掘概述3
1.1 數據挖掘的基本概念4
1.2 數據挖掘的起源與發(fā)展7
1.3 數據挖掘的應用產業(yè)與行業(yè)11
1.4 數據挖掘相關的幾個概念19
第2章 數據挖掘任務和方法26
2.1 大數據挖掘的任務27
2.2 數據挖掘的常見方法33
工 具 篇
第3章 數據挖掘平臺PMT57
3.1 PMT概述58
3.2 PMT使用說明72
3.3 PMT的特點74
第4章 數據挖掘認知實驗80
4.1 分類預測認知實驗81
4.2 回歸預測認知實驗84
4.3 聚類分析認知實驗88
4.4 關聯規(guī)則認知實驗91
實 訓 篇
實訓1 基于時間序列的分倉商品需求預測99
實訓背景100
實訓分析100
核心知識點101
實訓步驟104
拓展與思考118
實訓2 基于聚類分析(K-means)的快遞企業(yè)客戶群識別119
實訓背景120
實訓分析120
核心知識點121
實訓步驟122
拓展與思考140
實訓3 基于關聯規(guī)則的超市顧客購物行為分析142
實訓背景143
實訓分析143
核心知識點143
實訓步驟144
拓展與思考154
實訓4 基于決策樹的電信流失客戶預警與分析155
實訓背景156
實訓分析156
核心知識點157
實訓步驟161
拓展與思考178
實訓5 基于神經網絡算法的共享單車需求預測180
實訓背景181
實訓分析181
核心知識點182
實訓步驟184
拓展與思考200
實訓6 基于邏輯回歸算法的信用風險預測201
實訓背景202
實訓分析202
核心知識點203
實訓步驟204
拓展與思考215
實訓7 深度學習在圖像識別及圖像分類領域中的應用217
實訓背景218
實訓分析218
核心知識點219
實訓步驟220
拓展與思考232
參考文獻233