隨著計(jì)算機(jī)和互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展和廣泛普及,互聯(lián)網(wǎng)已經(jīng)成為人類獲取知識(shí)的最大平臺(tái)。在爬取了Web網(wǎng)頁語料后,需要通過數(shù)據(jù)預(yù)處理和數(shù)據(jù)分析來獲取數(shù)據(jù)的價(jià)值,從而造福人類,推動(dòng)社會(huì)發(fā)展。本書主要是Web大數(shù)據(jù)預(yù)處理和數(shù)據(jù)分析的實(shí)戰(zhàn)指南,內(nèi)容包括三部分:基礎(chǔ)知識(shí)、基于Python的數(shù)據(jù)預(yù)處理、基于Python的數(shù)據(jù)分析
決策問題中存在大量的冗余信息,而且很多信息都具有不確定性,面對(duì)這些雜亂無章的海量數(shù)據(jù),決策者需花費(fèi)大量時(shí)間分析,以至于可能錯(cuò)失決策良機(jī),因此研究具有不確定性的決策問題中冗余信息約簡是決策者亟待解決的關(guān)鍵問題。目前軟集合方法能夠較好地處理不確定決策問題,但軟集合約簡方法目前還不完善,致使對(duì)海量數(shù)據(jù)很難做出決策。本書主要以
天津?yàn)I海迅騰科技集團(tuán)有限公司編著的《大數(shù)據(jù)高可用環(huán)境搭建與運(yùn)維(企業(yè)級(jí)人才培養(yǎng)解決方案十三五規(guī)劃教材)》主要涉及11個(gè)項(xiàng)目,即大數(shù)據(jù)分布式集群、分布式集群基礎(chǔ)配置、ZooKeeper分布式協(xié)調(diào)系統(tǒng)、Hadoop高可用、Hive分布式數(shù)據(jù)倉庫工具、HBase分布式數(shù)據(jù)庫、大數(shù)據(jù)協(xié)作框架、Linux自動(dòng)化部署、Ambari
本書將大數(shù)據(jù)技術(shù)生態(tài)圈主流技術(shù)框架的應(yīng)用與發(fā)展、搭建Hadoop大數(shù)據(jù)分布式系統(tǒng)集群平臺(tái)、大數(shù)據(jù)分布式文件系統(tǒng)HDFS(HadoopDistributedFileSystem)、大數(shù)據(jù)分布式并行計(jì)算框架MapReduce、大數(shù)據(jù)汽車銷售數(shù)據(jù)統(tǒng)計(jì)分析項(xiàng)目5大模塊分為11章內(nèi)容進(jìn)行闡述。具體分布情況如下:第1章是大數(shù)據(jù)概論
本書采用理論與實(shí)踐相結(jié)合的方式,全面介紹了Hadoop大數(shù)據(jù)技術(shù)。主要內(nèi)容包括初識(shí)Hadoop大數(shù)據(jù)技術(shù)、Hadoop環(huán)境配置,分布式文件系統(tǒng)HDFS、資源調(diào)度框架YARN、分布式計(jì)算框架MapReduce、大數(shù)據(jù)數(shù)據(jù)倉庫Hive、分布式數(shù)據(jù)庫HBase、查詢大型半結(jié)構(gòu)化數(shù)據(jù)集的語言Pig、分布式日志采集工具Flume
“第1章認(rèn)識(shí)商務(wù)智能”,解釋了BI的相關(guān)概念及理論基礎(chǔ);“第2章實(shí)施商務(wù)智能”,講述了BI項(xiàng)目的實(shí)施過程;“第3章分析商務(wù)智能案例”,展示了企業(yè)真實(shí)BI案例的實(shí)施細(xì)節(jié)、成果及價(jià)值所在;第4章至第6章為商務(wù)智能開發(fā)工具;“第7章商務(wù)智能的應(yīng)用與發(fā)展趨勢(shì)”,介紹了BI的應(yīng)用及未來發(fā)展趨勢(shì)。
本書從系統(tǒng)的角度出發(fā),按照大數(shù)據(jù)處理流程的順序,全面介紹了大數(shù)據(jù)技術(shù)的基礎(chǔ)知識(shí),提升讀者對(duì)大數(shù)據(jù)的認(rèn)知。全書分3個(gè)邏輯層次,共9章。 本書作為大數(shù)據(jù)技術(shù)的基礎(chǔ)教材,目的不在于讓讀者對(duì)具體的某個(gè)技術(shù)平臺(tái)細(xì)節(jié)有很深的理解,而是盡量讓讀者體會(huì)整個(gè)大數(shù)據(jù)處理的技術(shù)流程,使讀者能夠掌握大數(shù)據(jù)技術(shù)的整體框架,能夠在未來的學(xué)習(xí)和工作
本書的主要內(nèi)容是非線性自抗擾控制的設(shè)計(jì)與理論分析.自抗擾控制是一項(xiàng)在線估計(jì)并補(bǔ)償不確定性因素的控制技術(shù),由三個(gè)主要部分構(gòu)成,分別是跟蹤微分器、擴(kuò)張狀態(tài)觀測(cè)器以及基于前兩者的反饋控制器.本書較為詳細(xì)地論述了非線性跟蹤微分器、非線性擴(kuò)張狀態(tài)觀測(cè)器的設(shè)計(jì)與收斂性,以及基于跟蹤微分器與擴(kuò)張狀態(tài)觀測(cè)器的不確定性因素補(bǔ)償控制器——
本書共8章,全面和詳盡地介紹了數(shù)據(jù)產(chǎn)品經(jīng)理的日常工作、需要的基礎(chǔ)知識(shí)和常用的分析方法,也介紹了數(shù)據(jù)倉庫的理論與應(yīng)用,以及大數(shù)據(jù)分析平臺(tái)、用戶行為分析平臺(tái)、AB實(shí)驗(yàn)平臺(tái)等數(shù)據(jù)產(chǎn)品的建設(shè),最后介紹了數(shù)據(jù)產(chǎn)品在各個(gè)業(yè)務(wù)領(lǐng)域中的應(yīng)用。從基礎(chǔ)知識(shí)到項(xiàng)目進(jìn)階,本書內(nèi)容充分結(jié)合業(yè)務(wù)實(shí)踐,剝開數(shù)據(jù)產(chǎn)品經(jīng)理的神秘面紗。本書講解了數(shù)據(jù)產(chǎn)品
本書詳細(xì)介紹了大數(shù)據(jù)挖掘技術(shù),全書分為3篇,共12章。第1篇為大數(shù)據(jù)分析基礎(chǔ),包括第1~4章,分別為大數(shù)據(jù)概述、大數(shù)據(jù)相關(guān)技術(shù)、數(shù)據(jù)預(yù)處理、R語言工具的使用。第2篇為大數(shù)據(jù)挖掘技術(shù),包括第5~11章,分別為線性分類方法、分類方法、聚類分析、關(guān)聯(lián)規(guī)則、預(yù)測(cè)方法與離群點(diǎn)診斷、時(shí)間序列分析、大數(shù)據(jù)挖掘可視化。第3篇為大數(shù)據(jù)挖