日韩免费无码人妻系列,欧美韩日本一本交道免费,80年代十大欧美成人片

本書系統(tǒng)地介紹了數(shù)據(jù)預(yù)處理､數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的原理､方法及應(yīng)用技術(shù), 以及采用Mahout 對(duì)相應(yīng)的挖掘算法進(jìn)行實(shí)際練習(xí)｡本書共有11 章, 分為兩大部分｡第1 ~7 章為理論部分｡第1 章為緒論, 介紹了數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)領(lǐng)域中的一些基本理論､研究方法等, 也簡(jiǎn)單介紹了Hadoop 生態(tài)系統(tǒng)中的Mahout; 第2 ~7 章按知識(shí)發(fā)現(xiàn)的過程, 介紹數(shù)據(jù)預(yù)處理的方法和技術(shù)､數(shù)據(jù)倉庫的構(gòu)建與OLAP 技術(shù)､數(shù)據(jù)挖掘原理及算法(包括關(guān)聯(lián)規(guī)則挖掘､聚類分析方法､分類規(guī)則挖掘)､常見的數(shù)據(jù)挖掘工具與產(chǎn)品｡第8 ~11 章為實(shí)驗(yàn)部分, 采用Mahout 對(duì)數(shù)據(jù)挖掘各類算法進(jìn)行實(shí)際練習(xí)｡
本書應(yīng)用性較強(qiáng), 與實(shí)踐相結(jié)合, 以小數(shù)據(jù)集為例詳細(xì)介紹各種挖掘算法, 使讀者更易掌握挖掘算法的基本原理及過程; 使用廣泛的大數(shù)據(jù)平臺(tái)———Hadoop 生態(tài)系統(tǒng)中的Mahout 對(duì)各種挖掘算法進(jìn)行實(shí)際練習(xí), 實(shí)戰(zhàn)性強(qiáng), 也符合目前數(shù)據(jù)處理與挖掘的發(fā)展趨勢(shì)｡
本書既便于教師課堂講授, 又便于自學(xué)者閱讀, 可作為高等院校高年級(jí)學(xué)生“數(shù)據(jù)挖掘技術(shù)” “數(shù)據(jù)倉庫與數(shù)據(jù)挖掘” “數(shù)據(jù)處理與智能決策”等課程的教材｡

前言

現(xiàn)在的社會(huì)是一個(gè)高速發(fā)展的社會(huì), 科技發(fā)達(dá), 信息暢通, 人們之間的交流越來越密切, 生活也越來越方便, 大數(shù)據(jù)就是這個(gè)高科技時(shí)代的產(chǎn)物, 并且將會(huì)以更多､更復(fù)雜､更多樣化的方式持續(xù)增長(zhǎng)｡大數(shù)據(jù)的復(fù)雜化和格式多樣化, 決定了應(yīng)用服務(wù)平臺(tái)中針對(duì)大數(shù)據(jù)的服務(wù)場(chǎng)景和類型的多樣化, 從而要求應(yīng)用服務(wù)平臺(tái)必須融合大數(shù)據(jù)技術(shù)來應(yīng)對(duì), 傳統(tǒng)的數(shù)據(jù)存儲(chǔ)和分析技術(shù)已無法滿足應(yīng)用的需求｡
目前行業(yè)中使用最廣泛的大數(shù)據(jù)平臺(tái)是基于Apache 開源社區(qū)版本的Hadoop 生態(tài)體系,阿里巴巴､騰訊､百度､臉書(Facebook) 等國內(nèi)外各大互聯(lián)網(wǎng)公司的系統(tǒng)基本都采用Hadoop生態(tài)系統(tǒng), 來完成數(shù)據(jù)存儲(chǔ)和處理｡事實(shí)上, 在未來2 ~3 年預(yù)計(jì)有超過50% 的大數(shù)據(jù)項(xiàng)目會(huì)在Hadoop 框架下運(yùn)行｡
在大數(shù)據(jù)時(shí)代, 大學(xué)生應(yīng)具備一定的大數(shù)據(jù)處理能力｡本書圍繞大數(shù)據(jù)背景下的數(shù)據(jù)處理和知識(shí)發(fā)現(xiàn)問題, 從基本概念入手, 由淺入深､循序漸進(jìn)地介紹了數(shù)據(jù)處理與知識(shí)發(fā)現(xiàn)過程中的數(shù)據(jù)預(yù)處理技術(shù)､數(shù)據(jù)倉庫技術(shù)､數(shù)據(jù)挖掘的基本方法, 并在最后使用最廣泛的大數(shù)據(jù)平臺(tái)———Hadoop 生態(tài)系統(tǒng)中的Mahout 對(duì)各種挖掘算法進(jìn)行實(shí)際練習(xí), 實(shí)戰(zhàn)性強(qiáng), 也符合目前數(shù)據(jù)處理與挖掘的發(fā)展趨勢(shì)｡
目前, 數(shù)據(jù)處理與知識(shí)發(fā)現(xiàn)及應(yīng)用方法逐漸成為各高校信息類和管理類本科專業(yè)的必修內(nèi)容｡本書作為立足于本科教學(xué)的教材, 具有如下特色:
(1) 在邏輯安排上循序漸進(jìn), 由淺入深, 便于讀者系統(tǒng)學(xué)習(xí)｡
(2) 內(nèi)容豐富, 信息量大, 融入了大量本領(lǐng)域的新知識(shí)和新方法｡
(3) 作為教材, 以小數(shù)據(jù)集為例詳細(xì)介紹各種挖掘算法, 使讀者更易掌握挖掘算法的基本原理及過程; 使用Mahout 實(shí)踐各種挖掘算法, 符合大數(shù)據(jù)的發(fā)展趨勢(shì)｡
(4) 圖文并茂, 形式生動(dòng), 可讀性強(qiáng)｡
本書的編寫得到了武漢民辦高校合作聯(lián)盟､武昌首義學(xué)院信息科學(xué)與工程學(xué)院和機(jī)械工業(yè)出版社的大力支持和幫助, 在此深表謝意!
由于編者水平有限, 書中難免會(huì)出現(xiàn)不足之處, 歡迎讀者批評(píng)指證｡如果您有更多的寶貴意見, 歡迎發(fā)郵件至郵箱xuqin@ wsyu. edu. cn｡
編者

你還可能感興趣

我要評(píng)論