高等學(xué)校計算機(jī)規(guī)劃教材:數(shù)據(jù)挖掘原理與實踐
定 價:32 元
- 作者:蔣盛益 著
- 出版時間:2011/8/1
- ISBN:9787121140501
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP274
- 頁碼:284
- 紙張:膠版紙
- 版次:1
- 開本:16開
《高等學(xué)校計算機(jī)規(guī)劃教材:數(shù)據(jù)挖掘原理與實踐》分為數(shù)據(jù)挖掘理論和數(shù)據(jù)挖掘?qū)嵺`兩大部分;A(chǔ)理論部分的主要內(nèi)容包括數(shù)據(jù)挖掘的基本概念、數(shù)據(jù)挖掘的預(yù)處理、聚類分析、分類與回歸、關(guān)聯(lián)規(guī)則挖掘、例外點檢測。數(shù)據(jù)挖掘?qū)嵺`部分討論了數(shù)據(jù)挖掘在通信行業(yè)、文本挖掘等方面的實際應(yīng)用;通過四個案例展示了在通信行業(yè)中如何利用數(shù)據(jù)挖掘進(jìn)行客戶細(xì)分、客戶流失分析、客戶社會關(guān)系挖掘、業(yè)務(wù)交叉銷售;通過跨語言智能學(xué)術(shù)搜索系統(tǒng)和基于內(nèi)容的垃圾郵件識別兩個案例展示了數(shù)據(jù)挖掘在文本挖掘方面的應(yīng)用。
《高等學(xué)校計算機(jī)規(guī)劃教材:數(shù)據(jù)挖掘原理與實踐》可作為高等院校計算機(jī)電子商務(wù)及相關(guān)專業(yè)的學(xué)生相關(guān)的教材或參考書,也可供從事數(shù)據(jù)挖掘研究、設(shè)計等工作的科研、技術(shù)人員參考。
上篇 理論篇
第1章 緒 論
1.1 數(shù)據(jù)挖掘產(chǎn)生的背景
1.2 數(shù)據(jù)挖掘任務(wù)及過程
1.2.1 數(shù)據(jù)挖掘定義
1.2.2 數(shù)據(jù)挖掘?qū)ο?br>1.2.3 數(shù)據(jù)挖掘任務(wù)
1.2.4 數(shù)據(jù)挖掘過程
1.2.5 數(shù)據(jù)挖掘常用軟件簡介
1.3 數(shù)據(jù)挖掘應(yīng)用
1.3.1 數(shù)據(jù)挖掘在商業(yè)領(lǐng)域中的應(yīng)用
1.3.2 數(shù)據(jù)挖掘在計算機(jī)領(lǐng)域中的應(yīng)用
1.3.3 其他領(lǐng)域中的應(yīng)用
1.4 數(shù)據(jù)挖掘技術(shù)的前景、研究熱點
1.4.1 數(shù)據(jù)挖掘技術(shù)的價值和前景
1.4.2 數(shù)據(jù)挖掘的研究熱點
1.4.3 數(shù)據(jù)挖掘的未來發(fā)展
本章小結(jié)
習(xí)題
第2章 數(shù)據(jù)處理基礎(chǔ)
2.1 數(shù)據(jù)
2.1.1 數(shù)據(jù)及數(shù)據(jù)類型
2.1.2 數(shù)據(jù)集的類型
2.2 數(shù)據(jù)統(tǒng)計特性
2.2.1 數(shù)據(jù)的中心度量
2.2.2 數(shù)據(jù)散布程度度量
2.3 數(shù)據(jù)預(yù)處理
2.3.1 數(shù)據(jù)清理
2.3.2 數(shù)據(jù)聚合
2.3.3 數(shù)據(jù)變換
2.3.4 數(shù)據(jù)歸約
2.4 相似性度量
2.4.1 屬性之間的相似性度量
2.4.2 對象之間的相似性度量
2.5 本章小結(jié)
習(xí)題
第3章 分類與回歸
3.1 概述
3.2 決策樹分類方法
3.2.1 決策樹的基本概念
3.2.2 決策樹的構(gòu)建
3.2.3 ID3分類算法
3.2.4 C4.5分類算法
3.2.5 CART算法
3.3 貝葉斯分類方法
3.3.1 貝葉斯定理
3.3.2 樸素貝葉斯分類算法
3.4 K-最近鄰分類方法
3.4.1 K-最近鄰分類算法基本概念
3.4.2 K-最近鄰分類算法描述
3.4.3 k-最近鄰分類算法的優(yōu)缺點
3.5 神經(jīng)網(wǎng)絡(luò)分類方法
3.5.1 人工神經(jīng)網(wǎng)絡(luò)的基本概念
3.5.2 典型神經(jīng)網(wǎng)絡(luò)模型介紹
3.5.3 神經(jīng)網(wǎng)絡(luò)的優(yōu)缺點
3.6 支持向量機(jī)
3.7 集成學(xué)習(xí)法
3.8 不平衡類問題
3.9 分類模型的評價
3.9.1 分類模型性能評價指標(biāo)
3.9.2 分類模型的過分?jǐn)M合
3.9.3 評估分類模型性能的方法
3.10 回歸
3.10.1 線性回歸
3.10.2 非線性回歸
3.10.3 邏輯回歸
3.11 本章小結(jié)
習(xí)題
第4章 聚類分析
4.1 概述
4.1.1 聚類分析研究的主要內(nèi)容
4.1.2 數(shù)據(jù)挖掘?qū)垲愃惴ǖ囊?br>4.1.3 典型聚類方法簡介
4.2 基于劃分的聚類算法
4.2.1 基本k-means聚類算法
4.2.2 二分k-means算法
4.2.3 k-means聚類算法的拓展
4.2.4 k-medoids算法
4.3 層次聚類算法
4.3.1 BIRCH算法
4.3.2 CURE算法
4.3.3 ROCK算法
4.4 基于密度的聚類算法
4.5 基于圖的聚類算法
4.5.1 Chameleon聚類算法
4.5.2 基于SNN的聚類算法
4.6 一趟聚類算法
4.6.1 算法描述
4.6.2 聚類閾值的選擇策略
4.7 基于模型的聚類算法
4.7.1 期望最大化方法EM
4.7.2 概念聚類
4.7.3 SOM方法
4.8 聚類算法評價
本章小結(jié)
習(xí)題
第5章 關(guān)聯(lián)分析
5.1 概述
5.2 頻繁項集發(fā)現(xiàn)算法
5.2.1 Apriori 算法
5.2.2 Fp-growth算法
5.3 關(guān)聯(lián)規(guī)則的生成
5.4 非二元屬性的關(guān)聯(lián)規(guī)則挖掘
5.5 關(guān)聯(lián)規(guī)則的評價
5.5.1 支持度和置信度
5.5.2 相關(guān)性分析
5.5.3 辛普森悖論
5.6 序列模式
5.6.1 問題描述
5.6.2 序列模式發(fā)現(xiàn)算法
5.7 本章小結(jié)
習(xí)題
第6章 離群點挖掘
6.1 概述
6.2 基于統(tǒng)計的方法
6.3 基于距離的方法
6.4 基于相對密度的方法
6.5 基于聚類的方法
6.5.1 基于對象離群因子的方法
6.5.2 基于簇的離群因子方法
6.5.3 基于聚類的動態(tài)數(shù)據(jù)離群點檢測
6.6 離群點挖掘方法的評估
6.7 本章小結(jié)
習(xí)題
下篇 實踐篇
第7章 數(shù)據(jù)挖掘在電信業(yè)中的應(yīng)用
7.1 數(shù)據(jù)挖掘在電信業(yè)的應(yīng)用概述
7.1.1 客戶細(xì)分
7.1.2 客戶流失預(yù)測分析
7.1.3 客戶社會關(guān)系挖掘
7.1.4 業(yè)務(wù)交叉銷售
7.1.5 欺詐客戶識別
7.2 案例一: 客戶通話模式分析
7.2.1 概述
7.2.2 數(shù)據(jù)描述
7.2.3 數(shù)據(jù)預(yù)處理
7.2.4 發(fā)現(xiàn)之旅
7.3 案例二:基于通話數(shù)據(jù)的社會網(wǎng)絡(luò)分析
7.3.1 概述
7.3.2 客戶呼叫圖的構(gòu)建
7.3.3 客戶呼叫圖的一般屬性及其應(yīng)用
7.3.4 客戶呼叫圖的社區(qū)發(fā)現(xiàn)及應(yīng)用
7.4 案例三:客戶細(xì)分與流失分析
7.4.1 概述
7.4.2 數(shù)據(jù)準(zhǔn)備
7.4.3 數(shù)據(jù)預(yù)處理
7.4.4 客戶聚類分析
7.4.5 建立分類預(yù)測模型
7.4.6 模型評估與調(diào)整優(yōu)化
7.5 案例四:移動業(yè)務(wù)關(guān)聯(lián)分析
7.5.1 概述
7.5.2 數(shù)據(jù)準(zhǔn)備
7.5.3 數(shù)據(jù)預(yù)處理
7.5.4 關(guān)聯(lián)規(guī)則挖掘過程
7.5.5 規(guī)則的優(yōu)化
7.5.5 模型的應(yīng)用
7.6 本章小結(jié)
第8章 文本挖掘與Web數(shù)據(jù)挖掘
8.1 文本挖掘
8.1.1 分詞
8.1.2 文本表示與詞權(quán)重計算
8.1.3 文本特征選擇
8.1.4 文本分類
8.1.5 文本聚類
8.1.6 文檔自動摘要
8.2 Web數(shù)據(jù)挖掘
8.2.1 Web內(nèi)容挖掘
8.2.2 Web使用挖掘
8.2.3 Web結(jié)構(gòu)挖掘
8.3 案例五--跨語言智能學(xué)術(shù)搜索系統(tǒng)
8.3.1 混合語種文本分詞
8.3.2 基于機(jī)器翻譯的跨語言信息檢索
8.3.3 不同語種文本的搜索結(jié)果聚類
8.3.4 基于聚類的個性化信息檢索
8.3.5 基于聚類的查詢擴(kuò)展
8.3.6 其他檢索便利工具
8.3.7 系統(tǒng)性能評估
8.4 案例六--基于內(nèi)容的垃圾郵件識別
8.4.1 垃圾郵件識別方法簡介
8.4.2 基于內(nèi)容的垃圾郵件識別方法工作原理
8.4.3 一種基于聚類的垃圾郵件識別方法
8.5 本章小結(jié)
參考文獻(xiàn)