R語言數(shù)據(jù)挖掘(第3版)(基于R應用的統(tǒng)計學叢書)
定 價:59 元
叢書名:基于R應用的統(tǒng)計學叢書
- 作者:薛薇
- 出版時間:2023/1/1
- ISBN:9787300310381
- 出 版 社:中國人民大學出版社
- 中圖法分類:TP312
- 頁碼:388
- 紙張:
- 版次:3
- 開本:16
全書分為12章,第1章數(shù)據(jù)挖掘與R語言概述,第2章R的數(shù)據(jù)組織和整理,第3章R的數(shù)據(jù)可視化,第4章R的近鄰分析:數(shù)據(jù)預測,第5章R的決策樹:數(shù)據(jù)預測,第6章R的人工神經(jīng)網(wǎng)絡:數(shù)據(jù)預測,第7章R的支持向量機:數(shù)據(jù)預測,第8章R的一般聚類:揭示數(shù)據(jù)內在結構,第9章R的特色聚類:揭示數(shù)據(jù)內在結構,第10章R的關聯(lián)分析:揭示數(shù)據(jù)關聯(lián)性,第11章R的模式甄別:診斷異常數(shù)據(jù),第12章R的網(wǎng)絡分析初步。
第1章 數(shù)據(jù)挖掘與R語言概述
1.1 什么是數(shù)據(jù)挖掘
1.2 數(shù)據(jù)挖掘的結果
1.2.1 數(shù)據(jù)挖掘結果的呈現(xiàn)方式
1.2.2 數(shù)據(jù)挖掘結果的基本特征
1.3 數(shù)據(jù)挖掘能做什么
1.3.1 數(shù)據(jù)預測
1.3.2 發(fā)現(xiàn)數(shù)據(jù)的內在結構
1.3.3 發(fā)現(xiàn)關聯(lián)性
1.3.4 模式診斷
1.4 數(shù)據(jù)挖掘方法的特點
1.4.1 對目標契合度不高的數(shù)據(jù),怎樣的建模策略能夠更好地迎合分析的需要 1.4.2 對于海量、高維數(shù)據(jù),怎樣的建模策略能夠更好地揭示數(shù)據(jù)特征,提高分析效率
1.4.3 對于復雜類型和關系數(shù)據(jù),怎樣的建模策略能夠清晰地揭示數(shù)據(jù)的特征 1.5 數(shù)據(jù)挖掘的典型應用
1.5.1 數(shù)據(jù)挖掘在客戶細分研究中的應用
1.5.2 數(shù)據(jù)挖掘在客戶流失分析中的應用
1.5.3 數(shù)據(jù)挖掘在營銷響應分析中的應用
1.5.4 數(shù)據(jù)挖掘在交叉銷售中的應用
1.5.5 數(shù)據(jù)挖掘在欺詐甄別中的應用
1.6 R語言入門必備
1.6.1 R的包
1.6.2 R的下載安裝
1.6.3 R起步
1.6.4 R的運行方式和其他
1.7 RStudio簡介
1.8 本章函數(shù)列表
第2章 R的數(shù)據(jù)組織和整理
2.1 R的數(shù)據(jù)對象
2.1.1 從存儲角度劃分R對象
2.1.2 從結構角度劃分R對象
2.1.3 創(chuàng)建和訪問R的數(shù)據(jù)對象
2.2 向量的創(chuàng)建和訪問
2.2.1 創(chuàng)建只包含一個元素的向量
2.2.2 創(chuàng)建包含多個元素的向量
2.2.3 訪問向量中的元素
2.3 矩陣的創(chuàng)建和訪問
2.3.1 創(chuàng)建矩陣
2.3.2 訪問矩陣中的元素
2.4 數(shù)據(jù)框的創(chuàng)建和訪問
2.4.1 創(chuàng)建數(shù)據(jù)框
2.4.2 訪問數(shù)據(jù)框
2.5 數(shù)組和列表的創(chuàng)建和訪問
2.5.1 創(chuàng)建和訪問數(shù)組
2.5.2 創(chuàng)建和訪問列表
2.6 數(shù)據(jù)對象的相互轉換
2.6.1 不同存儲類型之間的轉換
2.6.2 不同結構類型之間的轉換
2.7 導入外部數(shù)據(jù)和保存數(shù)據(jù)
2.7.1 導入文本數(shù)據(jù)
2.7.2 導入SPSS數(shù)據(jù)
2.7.3 利用ODBC導入數(shù)據(jù)庫數(shù)據(jù)和Excel表數(shù)據(jù)
2.7.4 共享R自帶的數(shù)據(jù)包
2.7.5 數(shù)據(jù)保存
2.8 R語言程序設計基礎
2.8.1 R程序設計基本概念
2.8.2 R的系統(tǒng)函數(shù)
2.8.3 用戶自定義函數(shù)
2.8.4 R程序的控制結構
2.9 R語言數(shù)據(jù)整理和程序設計綜合應用
2.9.1 數(shù)據(jù)整理基礎綜合應用
2.9.2 利用流程控制還原匯總數(shù)據(jù)
2.10 本章函數(shù)列表
第3章 R的數(shù)據(jù)可視化
3.1 繪圖基礎
3.1.1 圖形設備和圖形文件
3.1.2 圖形組成和圖形參數(shù)
3.2 單變量分布特征的可視化
3.2.1 核密度圖
3.2.2 小提琴圖
3.2.3 克利夫蘭點圖
3.3 多變量聯(lián)合分布特征的可視化
3.3.1 曲面圖和等高線圖
3.3.2 二元核密度曲面圖
3.3.3 雷達圖
3.4 變量間相關性的可視化
3.4.1 馬賽克圖
3.4.2 散點圖
3.4.3 相關系數(shù)圖
3.5 本章函數(shù)列表
第4章 R的近鄰分析:數(shù)據(jù)預測
4.1 近鄰分析: K近鄰法
4.1.1 K近鄰法中的距離
4.1.2 K近鄰法中的近鄰個數(shù)
4.2 K近鄰法的R函數(shù)和應用示例
4.2.1 R的K近鄰法函數(shù)
4.2.2 R的K近鄰法示例
4.3 K近鄰法的適用性及特征選擇
4.3.1 K近鄰法的適用性
4.3.2 特征選擇
4.4 本章函數(shù)列表
第5章 R的決策樹:數(shù)據(jù)預測
5.1 決策樹算法概述
5.1.1 什么是決策樹
5.1.2 決策樹的幾何理解
5.1.3 決策樹的核心問題
5.2 分類回歸樹的生長過程
5.2.1 分類樹的生長過程
5.2.2 回歸樹的生長過程
5.2.3 損失矩陣對分類樹的影響
5.3 分類回歸樹的剪枝
5.3.1 最小代價復雜度的測度
5.3.2 分類回歸樹后剪枝過程
5.3.3 分類回歸樹的交叉驗證剪枝
5.4 分類回歸樹的R函數(shù)和應用示例
5.4.1 分類回歸樹的R函數(shù)
5.4.2 分類回歸樹的應用示例
5.5 建立分類回歸樹的組合預測模型
5.5.1 袋裝技術
5.5.2 袋裝技術的R函數(shù)及應用示例
5.5.3 提升技術
5.5.4 提升技術的R函數(shù)及應用示例
5.6 隨機森林
5.6.1 隨機森林概述
5.6.2 隨機森林的R函數(shù)和應用示例
5.7 本章函數(shù)列表
第6章 R的人工神經(jīng)網(wǎng)絡:數(shù)據(jù)預測
6.1 人工神經(jīng)網(wǎng)絡概述
6.1.1 人工神經(jīng)網(wǎng)絡的概念和種類
6.1.2 人工神經(jīng)網(wǎng)絡中的節(jié)點和意義
6.1.3 人工神經(jīng)網(wǎng)絡建立的一般步驟
6.1.4 感知機模型
6.2 B-P反向傳播網(wǎng)絡
6.2.1 B-P反向傳播網(wǎng)絡的特點
6.2.2 B-P反向傳播算法
6.2.3 B-P反向傳播網(wǎng)絡中的學習率
6.3 B-P反向傳播網(wǎng)絡的R函數(shù)和應用示例
6.3.1 neuralnet包中的neuralnet函數(shù)
6.3.2 neuralnet函數(shù)的應用示例
6.3.3 利用ROC曲線確定概率分割值
6.3.4 nnet包中的nnet函數(shù)
6.4 本章函數(shù)列表
第7章 R的支持向量機:數(shù)據(jù)預測
7.1 支持向量分類概述
7.1.1 支持向量分類的基本思路
7.1.2 支持向量分類的三種情況
7.2 線性可分問題下的支持向量分類
7.2.1 如何求解超平面
7.2.2 如何利用超平面進行預測
7.3 廣義線性可分問題下的支持向量分類
7.3.1 如何求解超平面
7.3.2 可調參數(shù)的意義
7.4 線性不可分問題下的支持向量分類
7.4.1 線性不可分問題的一般解決方式
7.4.2 支持向量分類克服維災難的途徑
7.5 多分類的支持向量分類
7.6 支持向量回歸
7.6.1 支持向量回歸與一般線性回歸
7.6.2 支持向量回歸的基本思路
7.7 R的支持向量機及應用示例
7.7.1 R的支持向量機函數(shù)
7.7.2 利用R模擬線性可分下的支持向量分類
7.7.3 利用R模擬線性不可分下的支持向量分類
7.7.4 利用R模擬多分類的支持向量分類
7.8 本章函數(shù)列表
第8章 R的一般聚類:揭示數(shù)據(jù)內在結構
8.1 聚類分析概述
8.1.1 聚類分析的目的
8.1.2 聚類算法概述
8.2 基于質心的聚類模型:K-Means聚類
8.2.1 K-Means聚類中的距離測度
8.2.2 K-Means聚類過程
8.2.3 R的K-Means聚類函數(shù)
8.2.4 K-Means聚類的R模擬和應用示例
8.3 基于質心的聚類模型:PAM聚類
8.3.1 PAM聚類過程
8.3.2 R的PAM聚類函數(shù)和應用示例
8.4 基于聯(lián)通性的聚類模型:層次聚類
8.4.1 層次聚類的基本過程
8.4.2 層次聚類中距離的聯(lián)通性測度
8.4.3 層次聚類的R函數(shù)和應用示例
8.5 基于統(tǒng)計分布的聚類模型:EM聚類
8.5.1 基于統(tǒng)計分布的聚類模型的出發(fā)點:有限混合分布
8.5.2 EM聚類
8.5.3 R的EM聚類函數(shù)和應用示例
8.6 本章函數(shù)列表
第9章 R的特色聚類:揭示數(shù)據(jù)內在結構
9.1 BIRCH聚類
9.1.1 BRICH聚類的特點
9.1.2 BIRCH算法中的聚類特征和聚類特征樹
9.1.3 BIRCH的聚類過程
9.1.4 BRICH聚類的R函數(shù)和應用示例
9.2 SOM網(wǎng)絡聚類
9.2.1 SOM網(wǎng)絡聚類設計的出發(fā)點
9.2.2 SOM網(wǎng)絡的拓撲結構和聚類原理
9.2.3 SOM網(wǎng)絡聚類的R函數(shù)和應用示例
9.2.4 SOM網(wǎng)絡聚類應用:手寫郵政編碼識別
9.2.5 拓展SOM網(wǎng)絡:數(shù)據(jù)預測
9.3 基于密度的聚類模型:DBSCAN聚類
9.3.1 DBSCAN聚類原理
9.3.2 DBSCAN聚類的R函數(shù)和應用示例
9.4 本章函數(shù)列表
第10章 R的關聯(lián)分析:揭示數(shù)據(jù)關聯(lián)性
10.1 簡單關聯(lián)規(guī)則及其測度
10.1.1 什么是簡單關聯(lián)規(guī)則
10.1.2 簡單關聯(lián)規(guī)則的有效性和實用性
10.2 Apriori算法及應用示例
10.2.1 搜索頻繁項集
10.2.2 依據(jù)頻繁項集產(chǎn)生簡單關聯(lián)規(guī)則
10.2.3 Apriori算法的R函數(shù)和應用示例
10.2.4 簡單關聯(lián)規(guī)則的可視化R函數(shù)和應用示例
10.3 簡單關聯(lián)分析的應用示例
10.3.1 發(fā)現(xiàn)連帶銷售商品
10.3.2 顧客選擇性傾向對比
10.4 本章函數(shù)列表
第11章 R的模式甄別:診斷異常數(shù)據(jù)
11.1 模式甄別方法和評價概述
11.1.1 模式甄別方法
11.1.2 模式甄別結果及評價
11.2 模式甄別的無監(jiān)督偵測方法及應用示例
11.2.1 依概率偵測模式及R應用示例
11.2.2 依距離偵測模式:DB方法及 R應用示例
11.2.3 依密度偵測模式:LOF方法及 R應用示例
11.3 模式甄別的有監(jiān)督偵測方法及應用示例
11.3.1 樸素貝葉斯分類法
11.3.2 Logistic回歸及示例
11.3.3 非平衡數(shù)據(jù)集的SMOTE處理
11.4 模式甄別的半監(jiān)督偵測方法及應用示例
11.4.1 半監(jiān)督分類:自訓練分類模型
11.4.2 自訓練分類模型的R函數(shù)及應用示例
11.5 本章函數(shù)列表
第12章 R的網(wǎng)絡分析初步
12.1 網(wǎng)絡的定義、表示及構建
12.1.1 網(wǎng)絡的圖論定義及R函數(shù)
12.1.2 網(wǎng)絡的矩陣表示方式及 R函數(shù)
12.1.3 R的網(wǎng)絡數(shù)據(jù)文件和建立網(wǎng)絡對象
12.1.4 R的網(wǎng)絡可視化
12.2 網(wǎng)絡節(jié)點重要性的測度
12.2.1 度和測地線距離
12.2.2 節(jié)點“中心”作用的測度:點度中心度和接近中心度
12.2.3 節(jié)點“樞紐”作用的測度:中間中心度
12.2.4 節(jié)點重要性的其他方面:結構洞和關節(jié)點、特征向量中心度和 PageRank得分
12.3 網(wǎng)絡子群構成特征研究
12.3.1 二元關系和三元關系及 R函數(shù)
12.3.2 派系和 k核及R函數(shù)
12.3.3 社區(qū)和組件及R函數(shù)
12.4 網(wǎng)絡整體特征刻畫
12.4.1 網(wǎng)絡整體特征的測度
12.4.2 網(wǎng)絡特征的各種分布和度量
12.5 主要網(wǎng)絡類型及特點
12.5.1 規(guī)則網(wǎng)絡
12.5.2 隨機網(wǎng)絡
12.5.3 小世界網(wǎng)絡
12.5.4 無標度網(wǎng)絡
12.6 本章函數(shù)列表