《數(shù)據(jù)挖掘技術(shù)》是基于數(shù)據(jù)挖掘經(jīng)典算法及數(shù)據(jù)挖掘領(lǐng)域最新研究技術(shù)進(jìn)行數(shù)據(jù)分析的教材。全書內(nèi)容包括數(shù)據(jù)挖掘概述、分類算法、聚類算法、關(guān)聯(lián)規(guī)則算法及相應(yīng)典型算法的算法描述及分析等。對(duì)當(dāng)前數(shù)據(jù)挖掘的新技術(shù)——流數(shù)據(jù)挖掘技術(shù)、高維聚類算法、分布式數(shù)據(jù)挖掘、物聯(lián)網(wǎng)數(shù)據(jù)挖掘進(jìn)行了詳細(xì)的介紹。該部分在講述基本概念及典型算法的基礎(chǔ)上配有新研究的算法模型及分析,并有實(shí)驗(yàn)數(shù)據(jù)分析及結(jié)果顯示。最后對(duì)其他數(shù)據(jù)挖掘新技術(shù),包括業(yè)務(wù)活動(dòng)監(jiān)控挖掘技術(shù)、云計(jì)算平臺(tái)架構(gòu)和數(shù)據(jù)挖掘方法及思維流程數(shù)據(jù)挖掘技術(shù)進(jìn)行了描述。
本書可以作為高等院校信息管理、數(shù)理統(tǒng)計(jì)等專業(yè)有關(guān)數(shù)據(jù)挖掘教學(xué)的本科生或者研究生的專業(yè)課教材,也可以作為各類相關(guān)培訓(xùn)班的教材,還可以作為從事數(shù)據(jù)分析、智能產(chǎn)品軟件開發(fā)人員的參考書及數(shù)據(jù)挖掘愛好者的自學(xué)用書。
第1章 數(shù)據(jù)挖掘概述 1.1 數(shù)據(jù)挖掘的概念 1.1.1 KDD與數(shù)據(jù)挖掘 1.1.2 數(shù)據(jù)挖掘過(guò)程 1.1.3 數(shù)據(jù)挖掘任務(wù) 1.2 數(shù)據(jù)挖掘的發(fā)展歷程 1.3 數(shù)據(jù)挖掘 第1章 數(shù)據(jù)挖掘概述 1.1 數(shù)據(jù)挖掘的概念 1.1.1 KDD與數(shù)據(jù)挖掘 1.1.2 數(shù)據(jù)挖掘過(guò)程 1.1.3 數(shù)據(jù)挖掘任務(wù) 1.2 數(shù)據(jù)挖掘的發(fā)展歷程 1.3 數(shù)據(jù)挖掘的分類 1.4 數(shù)據(jù)挖掘的研究方法 1.4.1 統(tǒng)計(jì)分析方法 1.4.2 決策樹方法 1.4.3 模糊集方法 1.4.4 粗糙集方法 1.4.5 人工神經(jīng)網(wǎng)絡(luò)方法 1.4.6 遺傳算法 1.5 國(guó)內(nèi)外數(shù)據(jù)挖掘研究現(xiàn)狀 本章小結(jié) 參考文獻(xiàn)第2章 分類算法分析 2.1 分類概念 2.2 分類方法 2.3 決策樹算法 2.3.1 ID3算法 2.3.2 C4.5 算法 2.4 貝葉斯分類 2.5 粗糙集方法 2.5.1 粗糙集模型擴(kuò)展 2.5.2 粗糙集與其他不確定信息處理理論的關(guān)系 2.6 遺傳算法 2.7 其他分類算法 本章小結(jié) 參考文獻(xiàn)第3章 聚類算法分析 3.1 聚類分析概述 3.1.1 聚類分析概念 3.1.2 聚類分析中的數(shù)據(jù)類型 3.2 聚類分類 3.3 劃分方法 3.3.1 K—means算法 3.3.2 Kmedoid算法 3.4 層次方法 3.4.1 BIRCH算法 3.4.2 CURE算法 3.5 密度方法 3.5.1 DBSCAN算法 3.5.2 OPTICS算法 3.6 網(wǎng)格方法 3.6.1 STING算法 3.6.2 Wavecluster算法 3.7 基于標(biāo)量化Ⅲ的聚類統(tǒng)計(jì)算法 3.7.1 數(shù)學(xué)描述 3.7.2 計(jì)算方法 3.7.3 文本數(shù)據(jù) 3.7.4 應(yīng)用實(shí)例 3.8 其他聚類算法 本章小結(jié) 參考文獻(xiàn)第4章 關(guān)聯(lián)規(guī)則算法分析 4.1 關(guān)聯(lián)規(guī)則概念 4.2 頻繁模式挖掘 4.2.1 Apriori算法 4.2.2 FP-Growth算法 4.2.3 DHP算法 4.2.4 DIC算法 4.3 序列模式挖掘 4.3.1 序列模式挖掘的相關(guān)概念 4.3.2 基于Apriori的序列模式挖掘算法 4.3.3 基于序列模式增長(zhǎng)的序列模式挖掘算法 4.4 其他關(guān)聯(lián)規(guī)則算法 4.4.1 并行Apriori-like算法 4.4.2 并行FP-Growth算法 本章小結(jié) 參考文獻(xiàn)第5章 流數(shù)據(jù)挖掘技術(shù) 5.1 流數(shù)據(jù)挖掘技術(shù)概述 5.1.1 流數(shù)據(jù)概念 5.1.2 流數(shù)據(jù)模型 5.1.3 流數(shù)據(jù)挖掘算法特點(diǎn) 5.2 流數(shù)據(jù)挖掘技術(shù)分類 5.2.1 概要數(shù)據(jù)結(jié)構(gòu) 5.2.2 滑動(dòng)窗口技術(shù) 5.2.3 多窗口和衰減因子技術(shù) 5.2.4 近似技術(shù)、自適應(yīng)技術(shù)和子空間技術(shù) 5.3 流數(shù)據(jù)聚類算法 5.3.1 CluStream算法 5.3.2 STREAM算法 5.3.3 D-Stream算法 5.3.4 GSCDS算法 5.3.5 HCluStrearn算法 5.4 流數(shù)據(jù)頻繁項(xiàng)集挖掘算法 5.4.1 FPN算法 5.4.2 NEC算法 5.4.3 Kaal算法 5.5 流數(shù)據(jù)分類算法 5.5.1 VFDT算法 5.5.2 CVFDT算法 5.6 多數(shù)據(jù)流挖掘算法 5.7 實(shí)時(shí)數(shù)據(jù)流挖掘技術(shù) 5.7.1 實(shí)時(shí)數(shù)據(jù)挖掘概述 5.7.2 實(shí)時(shí)數(shù)據(jù)挖掘方法 5.7.3 實(shí)時(shí)數(shù)據(jù)挖掘框架 5.7.4 實(shí)時(shí)數(shù)據(jù)挖掘模型 5.7.5 實(shí)時(shí)數(shù)據(jù)挖掘技術(shù)分類 5.8 流數(shù)據(jù)聚類演化分析 5.9 流數(shù)據(jù)挖掘新技術(shù)研究 本章小結(jié) 參考文獻(xiàn)第6章 高維聚類算法 6.1 高維聚類算法概述 6.1.1 高維聚類算法 6.1.2 高維度數(shù)據(jù)處理方法 6.2 高維數(shù)據(jù)流聚類分類 6.3 維度對(duì)聚類算法精度的影響 6.3.1 維度對(duì)數(shù)據(jù)對(duì)象間距離的影響 6.3.2 維度對(duì)算法聚類精度的影響 6.3.3 傳統(tǒng)方法降維實(shí)驗(yàn) 6.4 混合類型屬性聚類算法 6.4.1 混合類型屬性的處理 6.4.2 UCI數(shù)據(jù)集實(shí)驗(yàn)分析 6.4.3 流數(shù)據(jù)實(shí)驗(yàn)分析 6.5 基于復(fù)相關(guān)系數(shù)倒數(shù)的降維 6.5.1 復(fù)相關(guān)系數(shù) 6.5.2 復(fù)相關(guān)系數(shù)倒數(shù)加權(quán) 6.5.3 降維實(shí)驗(yàn)分析 本章小結(jié) 參考文獻(xiàn)第7章 分布式數(shù)據(jù)挖掘 7.1 分布式數(shù)據(jù)挖掘概述 7.2 分布式聚類算法 7.2.1 分布式聚類算法分析 7.2.2 分布式K-means聚類算法 7.2.3 分布式聚類算法K-DMeans 7.2.4 分布式聚類算法DK-Means 7.3 DRA-Kmeans聚類算法 7.3.1 DRA-Kmeans聚類算法相關(guān)技術(shù) 7.3.2 DRA-Kmeans局部聚類算法 7.3.3 DRA-Kmeans全局聚類算法 7.4 分布式數(shù)據(jù)挖掘新技術(shù)研究 本章小結(jié) 參考文獻(xiàn)第8章 物聯(lián)網(wǎng)數(shù)據(jù)挖掘 8.1 物聯(lián)網(wǎng)數(shù)據(jù)挖掘概述 8.2 物聯(lián)網(wǎng)數(shù)據(jù)挖掘技術(shù)分類 8.2.1 物聯(lián)網(wǎng)環(huán)境下基于分類的數(shù)據(jù)挖掘方法 8.2.2 物聯(lián)網(wǎng)環(huán)境下基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘方法 8.2.3 物聯(lián)網(wǎng)環(huán)境下基于聚類分析的數(shù)據(jù)挖掘方法 8.2.4 物聯(lián)網(wǎng)環(huán)境下基于時(shí)間序列分析的數(shù)據(jù)挖掘方法 8.3 無(wú)線傳感器網(wǎng)絡(luò)中的聚類算法 8.4 RA-Cluster算法 8.5 物聯(lián)網(wǎng)路由算法 8.5.1 無(wú)線分布式網(wǎng)絡(luò)及其路由協(xié)議 8.5.2 物聯(lián)網(wǎng)路由算法分析 8.5.3 RA-AODVjr算法原理 8.5.4 RA-AODVjr算法實(shí)驗(yàn)分析 8.6 物聯(lián)網(wǎng)數(shù)據(jù)挖掘新技術(shù)研究 本章小結(jié) 參考文獻(xiàn)第9章 數(shù)據(jù)挖掘新技術(shù) 9.1 業(yè)務(wù)活動(dòng)監(jiān)控挖掘技術(shù) 9.1.1 業(yè)務(wù)活動(dòng)監(jiān)控概述 9.1.2 業(yè)務(wù)活動(dòng)監(jiān)控系統(tǒng)預(yù)測(cè)模型 9.1.3 結(jié)構(gòu)數(shù)據(jù)挖掘理論 9.2 云計(jì)算平臺(tái)架構(gòu)及數(shù)據(jù)挖掘方法 9.2.1 基于云計(jì)算的分布式數(shù)據(jù)挖掘平臺(tái)架構(gòu) 9.2.2 基于云計(jì)算的分布式數(shù)據(jù)挖掘算法 9.3 思維流程數(shù)據(jù)挖掘技術(shù) 9.3.1 思維流程發(fā)現(xiàn)的基本思想 9.3.2 思維流程發(fā)現(xiàn)的關(guān)鍵任務(wù) 9.3.3 思維流程發(fā)現(xiàn)研究的關(guān)鍵問(wèn)題 本章小結(jié) 參考文獻(xiàn)