本書講解了一個大數(shù)據(jù)綜合項目——招聘網(wǎng)站職位分析。全書共分為6章,內(nèi)容分別是項目概述、搭建大數(shù)據(jù)集群環(huán)境、數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)分析與數(shù)據(jù)可視化。本書附有配套資源,包括源代碼、教學(xué)設(shè)計、教學(xué)課件等資源。同時為了幫助初學(xué)者更好地學(xué)習(xí)本書內(nèi)容,還提供了在線答疑,歡迎讀者關(guān)注。本書適用于高等院校本、?朴嬎銠C相關(guān)專業(yè)大數(shù)
本書從大數(shù)據(jù)分析角度入手,首先介紹了不同的大數(shù)據(jù)處理模式與代表性的處理系統(tǒng),其次對大數(shù)據(jù)分析所應(yīng)用的數(shù)據(jù)挖掘、機器學(xué)習(xí)的理論工具給予了介紹,最后詳細(xì)介紹了典型的大數(shù)據(jù)技術(shù)IBMInfoSphereBigInsights。 本書由3篇共25章組成。第1篇大數(shù)據(jù)系統(tǒng)基礎(chǔ),由第1章概述和第2章大數(shù)據(jù)基礎(chǔ)組成。第2篇大數(shù)據(jù)分
本書全面介紹了Hadoop生態(tài)系統(tǒng)中各個開源組件的理論知識和實踐案例。全書分為上篇——Hadoop基礎(chǔ)篇、中篇——Hadoop提高篇、下篇——案例篇三部分,共11章,涉及數(shù)據(jù)采集、數(shù)據(jù)存儲與管理、數(shù)據(jù)處理與分析、數(shù)據(jù)可視化一系列大數(shù)據(jù)應(yīng)用生命周期中各階段典型組件的理論知識、安裝部署和實戰(zhàn)使用。上篇為第1~8章,具體內(nèi)容
全書以包裝生產(chǎn)線為載體,以生產(chǎn)線設(shè)備制造與使用企業(yè)為依托,以生產(chǎn)線工作過程為主線,以實際應(yīng)用為宗旨,選取硬包裝、軟包裝和干包裝線中的重點設(shè)備如“沖洗瓶機、灌裝壓蓋機、封罐機、殺菌機、貼標(biāo)機、裝箱機、軟包裝機、氣調(diào)包裝機、熱成型包裝機、裹包機和打包機”11種典型設(shè)備,從“生產(chǎn)線認(rèn)知”導(dǎo)入,與“生產(chǎn)線輸送裝置”共編寫13章
本書是數(shù)據(jù)挖掘精髓的濃縮。第1章用通俗易懂的語言回答五個基本問題,包括什么是數(shù)據(jù),什么是大數(shù)據(jù),什么是數(shù)據(jù)挖掘,以及數(shù)據(jù)挖掘能挖掘出哪些東西和會產(chǎn)生什么價值。然后用6章的篇幅介紹k-均值、k-近鄰、樸素貝葉斯、決策樹、回歸分析和關(guān)聯(lián)規(guī)則挖掘等6種方法。第8章介紹一些實際的應(yīng)用,演示簡單的數(shù)據(jù)挖掘方法如何產(chǎn)生巨大的價值。
本書從設(shè)計學(xué)角度系統(tǒng)地整理了數(shù)據(jù)用于決策的設(shè)計工具和方法,闡述了從數(shù)據(jù)作為商品視角去應(yīng)用設(shè)計思維,提出了多級的數(shù)據(jù)產(chǎn)品理念以及產(chǎn)品化設(shè)計路徑,同時列舉了大量的案例,增強了本書的實用性。本書內(nèi)容主要包括數(shù)據(jù)經(jīng)濟時代、數(shù)據(jù)作為產(chǎn)品、數(shù)據(jù)加工模式、數(shù)據(jù)的價值感知、數(shù)據(jù)產(chǎn)品化要點、數(shù)據(jù)升級加工和數(shù)據(jù)產(chǎn)品化設(shè)計。
蝙蝠優(yōu)化算法是一種新穎的模擬蝙蝠行為的群智能優(yōu)化算法,因該算法有模型簡單、參數(shù)少、通用性強等優(yōu)點,故被廣泛應(yīng)用于解決實際問題。本書分為8章,第1~2章介紹蝙蝠優(yōu)化算法的基本框架、研究進展,并討論了蝙蝠算法的全局收斂性問題;第3~6章從蝙蝠算法的全局搜索方式、局部搜索方式、全局/局部搜索的平衡策略、全局/局部搜索的集成策
本書詳細(xì)地介紹了大數(shù)據(jù)、人工智能等項目中不可或缺的環(huán)節(jié)和內(nèi)容:數(shù)據(jù)準(zhǔn)備和特征工程。書中的每節(jié)首先以簡明方式介紹了基本知識;然后通過實際案例演示了基本知識的實際應(yīng)用,并提供了針對性練習(xí)項目,將“知識、案例、練習(xí)”融為一體;最后以“擴展探究”方式引導(dǎo)讀者進入更深廣的領(lǐng)域。本書既適合作為大學(xué)相關(guān)專業(yè)的教材,也適合作為大數(shù)據(jù)、
本書是結(jié)合職業(yè)教育的實際情況開發(fā)的云計算技術(shù)與應(yīng)用專業(yè)系列教材之一。對云計算技術(shù)與應(yīng)用專業(yè)、大數(shù)據(jù)技術(shù)與應(yīng)用專業(yè)或者大數(shù)據(jù)初學(xué)者是一本不錯的入門教程。本書強調(diào)理論知識以夠用為度,注重動手能力,在動手中逐漸掌握大數(shù)據(jù)相關(guān)技術(shù)。本書內(nèi)容包括大數(shù)據(jù)概述、Hadoop基礎(chǔ)知識、大數(shù)據(jù)平臺搭建、數(shù)據(jù)的獲取、數(shù)據(jù)清理、數(shù)據(jù)分析、數(shù)
本書基于Hadoop大數(shù)據(jù)平臺,講解大數(shù)據(jù)平臺的搭建與運維、大數(shù)據(jù)的采集與存儲、大數(shù)據(jù)的處理、數(shù)據(jù)的分析、數(shù)據(jù)的可視化等完整的大數(shù)據(jù)應(yīng)用案例,全面詳細(xì)地講述Hadoop、MapReduee、HDFS、Hive、Spark和Zookeeper等技術(shù)的相關(guān)知識;還詳細(xì)介紹了Hadoop大數(shù)據(jù)集群環(huán)境配置與搭建、部署配置Ha