對(duì)于入門和學(xué)習(xí)大數(shù)據(jù)技術(shù)的讀者來(lái)說(shuō),大數(shù)據(jù)技術(shù)的生態(tài)圈和知識(shí)體系過(guò)于龐大,可能還沒(méi)有開(kāi)始學(xué)習(xí)就已經(jīng)陷入眾多的陌生名詞和泛泛的概念中。本書的切入點(diǎn)明確而清晰,從Hadoop生態(tài)系統(tǒng)的明星Cloudera入手,逐步引出各類大數(shù)據(jù)基礎(chǔ)和核心應(yīng)用框架。本書分為18章,系統(tǒng)介紹Hadoop生態(tài)系統(tǒng)大數(shù)據(jù)相關(guān)的知識(shí),包括大數(shù)據(jù)概述
本書涉及與自動(dòng)化生產(chǎn)線相關(guān)的技術(shù)及理論,主要包括自動(dòng)化生產(chǎn)線概述、自動(dòng)化生產(chǎn)線的組成結(jié)構(gòu)、自動(dòng)化生產(chǎn)線的控制單元、自動(dòng)化生產(chǎn)線安裝與調(diào)試以及自動(dòng)化生產(chǎn)線設(shè)計(jì)、工業(yè)機(jī)器人及智能裝備、柔性自動(dòng)化生產(chǎn)線技術(shù)等內(nèi)容。
本書共分為10章,主要內(nèi)容包括:大數(shù)據(jù)分析生命周期概述、數(shù)據(jù)采集、數(shù)據(jù)清洗、可視化工具、數(shù)據(jù)建模、模型評(píng)估與優(yōu)化、出租車數(shù)據(jù)分析、音樂(lè)分類、知識(shí)圖譜制作、電影評(píng)論情感分析。
本書分為基礎(chǔ)篇和提高篇兩部分,共7章,主要內(nèi)容包括:Spark初識(shí)、Spark核心概念、Spark架構(gòu)與執(zhí)行流程、Spark流式計(jì)算、SparkSQL、Spark與機(jī)器學(xué)習(xí)、案例分析。
本書是學(xué)術(shù)著作,共7章,主要內(nèi)容包括白酒窖泥微生物多樣性研究方法及進(jìn)展,基于Miseq高通量測(cè)序技術(shù)古襄陽(yáng)酒窖泥細(xì)菌多樣性評(píng)價(jià),丟糟窖窖泥細(xì)菌多樣性評(píng)價(jià),退化和正常窖泥微生物多樣性的比較分析,基于DGGE的窖泥細(xì)菌與乳酸菌多樣性研究,濃香型白酒窖泥中乳酸菌的分離及其在柑橘酒中的應(yīng)用,古襄陽(yáng)濃香型白酒窖泥中乳酸菌分離株目
《大數(shù)據(jù)背景下數(shù)據(jù)挖掘及處理分析》內(nèi)容首先對(duì)大數(shù)據(jù)及數(shù)據(jù)挖掘技術(shù)原理進(jìn)行論述,然后對(duì)于數(shù)據(jù)的獲取、可視化分析以及基于R語(yǔ)言的數(shù)據(jù)分析進(jìn)行探索,針對(duì)數(shù)據(jù)的甄別模式和知識(shí)圖譜與圖數(shù)據(jù)挖掘分析,將數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)進(jìn)行對(duì)比分析,結(jié)合應(yīng)用實(shí)例探索數(shù)據(jù)挖掘的發(fā)展趨勢(shì)。《大數(shù)據(jù)背景下數(shù)據(jù)挖掘及處理分析》可使大家全面了解數(shù)據(jù)挖掘的技
大數(shù)據(jù)可視化這種新的視覺(jué)表達(dá)形式是應(yīng)信息社會(huì)蓬勃發(fā)展而出現(xiàn)的——因?yàn)槲覀儾粌H要呈現(xiàn)世界,更重要的是要通過(guò)呈現(xiàn)來(lái)處理更龐大的數(shù)據(jù),理解各種各樣的數(shù)據(jù)集合,表現(xiàn)多維數(shù)據(jù)之間的關(guān)聯(lián)。換句話說(shuō),就是歸納數(shù)據(jù)內(nèi)在的模式、關(guān)聯(lián)和結(jié)構(gòu)。復(fù)雜數(shù)據(jù)可視化既涉及科學(xué)也涉及設(shè)計(jì),它的藝術(shù)性實(shí)際上是使用獨(dú)特手法展示萬(wàn)千世界的某個(gè)局部,從而提出
本課程的教學(xué)內(nèi)容主要包括聚類、關(guān)聯(lián)、降維、變量選擇、分類與預(yù)測(cè)、集成算法、圖模型與推薦系統(tǒng)等。每一部分都是本課程授課的主要內(nèi)容,都力求深入淺出,精講細(xì)講,不光講解各種方法的過(guò)程與原理,還要加強(qiáng)學(xué)生對(duì)各種方法的深入理解。
本書著力于介紹數(shù)據(jù)挖掘基礎(chǔ)知識(shí)、基本原理、常用算法,主要內(nèi)容包括數(shù)據(jù)挖掘概述、數(shù)據(jù)的描述與可視化、數(shù)據(jù)的采集和預(yù)處理、數(shù)據(jù)的歸約、關(guān)聯(lián)規(guī)則挖掘、分類與預(yù)測(cè)、非線性預(yù)測(cè)模型、聚類分析、深度學(xué)習(xí)簡(jiǎn)介、使用Weka進(jìn)行數(shù)據(jù)挖掘。本書通俗易懂,注重基礎(chǔ)知識(shí)、基本原理和基本方法,注重啟發(fā)和引申,以培養(yǎng)學(xué)生獨(dú)立思考和獨(dú)立發(fā)現(xiàn)的能力
本書呈現(xiàn)了文本挖掘領(lǐng)域先進(jìn)的算法,同時(shí)從學(xué)術(shù)界和產(chǎn)業(yè)界的角度介紹了文本挖掘。本書涉及的業(yè)界學(xué)者跨越多個(gè)國(guó)家,來(lái)自多個(gè)機(jī)構(gòu):大學(xué)、企業(yè)和政府實(shí)驗(yàn)室。本書介紹了文本挖掘在多個(gè)領(lǐng)域中的自動(dòng)文本分析和挖掘計(jì)算模型,這些領(lǐng)域包括:機(jī)器學(xué)習(xí)、知識(shí)發(fā)現(xiàn)、自然語(yǔ)言處理和信息檢索等。本書適合作為