數(shù)據(jù)挖掘算法與R語言實(shí)現(xiàn)
定 價(jià):45 元
- 作者:肖海軍
- 出版時(shí)間:2018/11/1
- ISBN:9787121339370
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP274;TP312
- 頁碼:180
- 紙張:
- 版次:01
- 開本:16K
本書在介紹R軟件基本功能的基礎(chǔ)上,介紹了數(shù)據(jù)挖掘十大經(jīng)典算法的基本原理及相應(yīng)的R語言實(shí)現(xiàn)范例,旨在使讀者能夠仿照范例快速掌握大數(shù)據(jù)分析的方法,從高維海量數(shù)據(jù)中挖掘有用的信息,使用合適的數(shù)據(jù)挖掘算法,解決實(shí)際問題。全書內(nèi)容共12章,分別介紹R軟件的使用方法、C4.5算法、k-means算法、CART算法、Apriori算法、EM算法、PageRank算法、AdaBoost算法、kNN算法、Naive Bayes算法、SVM算法及各算法的案例分析。本書理論部分簡單明了,所有程序均經(jīng)過R軟件實(shí)際運(yùn)行。本書各章自成體系,讀者既可從頭逐章學(xué)習(xí),也可隨意挑選自己需要的章節(jié)學(xué)習(xí)。讀者可登錄華信教育資源網(wǎng)www.hxedu.com.cn免費(fèi)下載算法實(shí)例代碼。本書既可作為高年級(jí)本科生、研究生相關(guān)課程的教材,也可作為不同領(lǐng)域數(shù)據(jù)分析人員的工具書,還可作為零基礎(chǔ)讀者的自學(xué)教材。
肖海軍,中國地質(zhì)大學(xué)(武漢)數(shù)學(xué)與物理學(xué)院教授,中國數(shù)學(xué)學(xué)會(huì)會(huì)員,中國計(jì)算機(jī)學(xué)會(huì)高級(jí)會(huì)員,中國電子學(xué)會(huì)高級(jí)會(huì)員。
目 錄
第1章 R軟件的使用方法 1
1.1 R軟件介紹和安裝 1
1.1.1 R軟件介紹 1
1.1.2 R軟件的安裝 1
1.1.3 R studio的安裝 2
1.2 R語言基本運(yùn)算 3
1.2.1 R語言的數(shù)值運(yùn)算 3
1.2.2 R語言的向量 5
1.2.3 R語言的向量運(yùn)算 6
1.3 R語言缺失數(shù)據(jù) 7
1.3.1 R語言缺失數(shù)據(jù)類型 7
1.3.2 R語言缺失數(shù)據(jù)識(shí)別 7
1.3.3 R語言缺失數(shù)據(jù)處理 8
1.4 矩陣的運(yùn)算 8
1.4.1 矩陣建立 8
1.4.2 矩陣計(jì)算 10
1.4.3 矩陣分解 11
1.5 列表和數(shù)據(jù)框 12
1.5.1 列表介紹 12
1.5.2 數(shù)據(jù)框介紹 13
1.6 R軟件的數(shù)據(jù)讀/寫 14
1.7 R軟件包介紹 15
1.7.1 包的基礎(chǔ)知識(shí) 15
1.7.2 自動(dòng)安裝包 15
1.7.3 通過硬盤加載包 16
1.7.4 常見包介紹 16
1.8 R語言的函數(shù) 16
1.8.1 循環(huán)結(jié)構(gòu) 16
1.8.2 條件執(zhí)行結(jié)構(gòu) 17
1.8.3 自定義函數(shù) 18
1.9 R軟件繪圖功能介紹 19
1.9.1 高級(jí)繪圖函數(shù) 20
1.9.2 低級(jí)繪圖函數(shù) 22
1.9.3 用ggplot2包進(jìn)行繪圖 25
第2章 C4.5算法 30
2.1 算法簡介 30
2.2 算法基本原理 30
2.3 算法的R語言實(shí)現(xiàn) 33
2.3.1 ctree函數(shù)介紹 33
2.3.2 C4.5決策樹的R語言實(shí)例 33
2.4 小結(jié) 35
參考文獻(xiàn) 36
第3章 k-means算法 37
3.1 算法簡介 37
3.2 算法基本原理 37
3.3 算法的R語言實(shí)現(xiàn) 39
3.3.1 kmeans函數(shù)介紹 39
3.3.2 k-means聚類的R語言實(shí)例 39
3.4 小結(jié) 41
參考文獻(xiàn) 42
第4章 CART算法 44
4.1 算法簡介 44
4.2 算法基本原理 44
4.2.1 CART算法的建樹 44
4.2.2 CART算法的剪枝 45
4.2.3 算法過程實(shí)例 46
4.3 算法的R語言實(shí)現(xiàn) 48
4.3.1 rpart函數(shù)介紹 48
4.3.2 CART決策樹的R語言實(shí)例 48
4.3.3 rpart函數(shù)的補(bǔ)充說明 50
4.4 小結(jié) 52
參考文獻(xiàn) 52
第5章 Apriori算法 53
5.1 算法簡介 53
5.2 算法基本原理 53
5.2.1 挖掘頻繁模式和關(guān)聯(lián)規(guī)則 53
5.2.2 Apriori算法 55
5.2.3 AprioriTid算法 61
5.2.4 挖掘順序模式 64
5.2.5 Apriori算法的一種改進(jìn)算法 65
5.3 算法的R語言實(shí)現(xiàn)算法 66
5.3.1 apriori函數(shù)介紹 66
5.3.2 Apriori模型 66
5.4 小結(jié) 68
參考文獻(xiàn) 68
第6章 EM算法 70
6.1 算法簡介 70
6.2 算法基本原理 71
6.2.1 基礎(chǔ)理論 71
6.2.2 算法過程實(shí)例 71
6.3 算法的R語言實(shí)現(xiàn) 76
6.3.1 mclust函數(shù)介紹 76
6.3.2 EM標(biāo)準(zhǔn)模型的R語言實(shí)現(xiàn) 77
6.3.3 存在噪聲的EM算法的R語言實(shí)現(xiàn) 79
6.3.4 EM算法應(yīng)用于高斯混合模型(GMM) 81
6.3.5 EM算法應(yīng)用于Iris數(shù)據(jù)集 84
6.4 小結(jié) 84
參考文獻(xiàn) 85
第7章 PageRank算法 86
7.1 算法簡介 86
7.2 算法基本原理 86
7.3 算法的R語言實(shí)現(xiàn) 89
7.3.1 page.rank函數(shù)介紹 89
7.3.2 igraph包實(shí)現(xiàn)PageRank算法 89
7.3.3 自定義PageRank算法的R語言實(shí)現(xiàn) 90
7.3.4 補(bǔ)充實(shí)例 91
7.4 小結(jié) 95
參考文獻(xiàn) 96
第8章 AdaBoost算法 97
8.1 算法簡介 97
8.2 算法基本原理 97
8.2.1 Boosting算法 97
8.2.2 AdaBoost算法 98
8.2.3 算法過程實(shí)例 101
8.3 算法的R語言實(shí)現(xiàn) 102
8.3.1 boosting函數(shù)介紹 102
8.3.2 R語言實(shí)例 102
8.4 小結(jié) 104
參考文獻(xiàn) 104
第9章 kNN算法 105
9.1 算法簡介 105
9.2 算法基本原理 105
9.2.1 算法描述 105
9.2.2 算法流程 107
9.3 算法的R語言實(shí)現(xiàn) 108
9.3.1 knn函數(shù)介紹 108
9.3.2 利用class包中的knn函數(shù)建立模型 108
9.3.3 kNN算法應(yīng)用于Iris數(shù)據(jù)集 109
9.3.4 kNN算法應(yīng)用于Breast數(shù)據(jù)集 111
9.4 小結(jié) 113
參考文獻(xiàn) 114
第10章 Naive Bayes算法 115
10.1 算法簡介 115
10.2 算法基本原理 115
10.2.1 基礎(chǔ)理論 115
10.2.2 算法過程實(shí)例 118
10.3 算法的R語言實(shí)現(xiàn) 120
10.3.1 naiveBayes函數(shù)介紹 120
10.3.2 利用e1071包中的naiveBayes函數(shù)建立模型 120
10.3.3 算法拓展——其他改進(jìn)的Naive Bayes算法 121
10.4 小結(jié) 123
參考文獻(xiàn) 123
第11章 SVM算法 125
11.1 算法簡介 125
11.2 算法基本原理 125
11.2.1 基礎(chǔ)理論 125
11.2.2 軟間隔優(yōu)化 127
11.2.3 核映射 129
11.2.4 SVM算法的過程 130
11.2.5 SVC算法過程實(shí)例 130
11.3 算法的R語言實(shí)現(xiàn) 132
11.3.1 svm函數(shù)介紹 132
11.3.2 標(biāo)準(zhǔn)分類模型 133
11.3.3 多分類模型 133
11.3.4 SVM回歸 134
11.3.5 SVM拓展包(kernlab包) 135
11.3.6 SVM算法應(yīng)用于Iris數(shù)據(jù)集(e1071包) 135
11.3.7 SVM算法應(yīng)用于Iris數(shù)據(jù)集(kernlab包) 136
11.4 小結(jié) 137
參考文獻(xiàn) 138
第12章 案例分析 139
12.1 關(guān)聯(lián)規(guī)則案例分析 139
12.1.1 問題描述 139
12.1.2 R語言實(shí)現(xiàn)過程 139
12.1.3 不同參數(shù)的Apriori模型 141
12.1.4 小結(jié) 145
12.2 kNN算法案例分析 145
12.2.1 問題描述 145
12.2.2 R語言實(shí)現(xiàn)過程 145
12.2.3 小結(jié) 148
12.3 Naive Bayes算法案例分析 149
12.3.1 問題描述 149
12.3.2 R語言實(shí)現(xiàn)過程 149
12.3.3 小結(jié) 152
12.4 CART算法案例分析 152
12.4.1 問題描述 152
12.4.2 R語言實(shí)現(xiàn)過程 152
12.4.3 小結(jié) 159
12.5 AdaBoost算法案例分析 159
12.5.1 問題描述 159
12.5.2 R語言實(shí)現(xiàn)過程 159
12.5.3 小結(jié) 161
12.6 SVM算法案例分析 162
12.6.1 問題描述 162
12.6.2 R語言實(shí)現(xiàn)過程 162
12.6.3 小結(jié) 167