精品香蕉伊思人在线观看,欧美日韩午夜一区二区,久久国产欧美另类久久久

本書采用理論實(shí)戰(zhàn)的形式編寫，全面介紹了Hadoop大數(shù)據(jù)挖掘的相關(guān)知識。本書共分為13章，涵蓋的主要內(nèi)容有：集群及開發(fā)環(huán)境搭建；快速構(gòu)建一個Hadoop項(xiàng)目并線上運(yùn)行；Hadoop套件實(shí)戰(zhàn)；Hive編程使用SQL提交MapReduce任務(wù)到Hadoop集群；游戲玩家的用戶行為分析特征提��；Hadoop平臺管理與維護(hù)；Hadoop異常處理解決方案；初識Hadoop核心源碼；Hadoop通信機(jī)制和內(nèi)部協(xié)議；Hadoop分布式文件系統(tǒng)剖析；ELK實(shí)戰(zhàn)案例游戲應(yīng)用實(shí)時日志分析平臺；Kafka實(shí)戰(zhàn)案例實(shí)時處理游戲用戶數(shù)據(jù)；Hadoop拓展Kafka剖析。本書不但適合剛?cè)腴T的初學(xué)者系統(tǒng)學(xué)習(xí)Hadoop的各種基礎(chǔ)語法和開發(fā)技巧，而且也適合有多年開發(fā)經(jīng)驗(yàn)的開發(fā)者進(jìn)階提高。另外，本書也適合社會培訓(xùn)機(jī)構(gòu)和相關(guān)院校作為教材或者教學(xué)參考書。

前言　　大數(shù)據(jù)時代，數(shù)據(jù)的存儲與挖掘至關(guān)重要。企業(yè)在追求高可靠性、高擴(kuò)展性及高容錯性的大數(shù)據(jù)處理平臺的同時還希望能夠降低成本，而Hadoop為實(shí)現(xiàn)這些需求提供了解決方案。
　　Hadoop在分布式計算與存儲上具有先天優(yōu)勢。它作為Apache軟件基金會的頂級開源項(xiàng)目，其版本迭代持續(xù)至今，而且已經(jīng)擁有一個非�；钴S的社區(qū)和全球眾多開發(fā)者，并且成為了當(dāng)前非常流行的大數(shù)據(jù)處理平臺。很多公司，特別是互聯(lián)網(wǎng)公司，都紛紛開始使用或者已經(jīng)使用Hadoop來做海量數(shù)據(jù)存儲與數(shù)據(jù)挖掘。
　　Hadoop簡單易學(xué)，其學(xué)習(xí)曲線平緩且學(xué)習(xí)周期短。它的操作命令和Linux命令非常相似。一個熟悉Linux的開發(fā)者只需要短短的一周時間，就可以學(xué)會Hadoop開發(fā)，完成一個高可用集群的部署和高可用應(yīng)用程序的編寫。
　　面對Hadoop的普及和學(xué)習(xí)熱潮，筆者愿意分享自己多年的開發(fā)經(jīng)驗(yàn)，帶領(lǐng)讀者比較輕松地掌握Hadoop數(shù)據(jù)挖掘的相關(guān)知識。這便是筆者編寫本書的原因。本書使用通俗易懂的語言進(jìn)行講解，從基礎(chǔ)部署到集群的管理，再到底層設(shè)計等內(nèi)容均有涉及。通過閱讀本書，讀者可以較為輕松地掌握Hadoop大數(shù)據(jù)挖掘與分析的相關(guān)技術(shù)。
本書特色　　1．提供專業(yè)的配套教學(xué)視頻，高效、直觀　　筆者曾接受過極客學(xué)院的專業(yè)視頻制作指導(dǎo)，并在極客學(xué)院錄制過多期Hadoop和Kafka實(shí)戰(zhàn)教學(xué)視頻課程，得到了眾多學(xué)習(xí)者的青睞及好評。為了便于讀者更加高效、直觀地學(xué)習(xí)本書內(nèi)容，筆者特意為本書實(shí)戰(zhàn)部分的內(nèi)容錄制了配套教學(xué)視頻，讀者可以在教學(xué)視頻的輔助下學(xué)習(xí)，從而更加輕松地掌握Hadoop。
　　2．分享大量來自一線的開發(fā)經(jīng)驗(yàn)，貼近實(shí)際開發(fā)　　本書給出的代碼講解和實(shí)例大多數(shù)來自于筆者多年的教學(xué)積累和技術(shù)分享，幾乎都是得到了學(xué)習(xí)者一致好評的干貨。另外，筆者還是一名開源愛好者，編寫了業(yè)內(nèi)著名的Kafka Eagle監(jiān)控系統(tǒng)。本書第13章介紹了該系統(tǒng)的使用，以幫助讀者掌握如何監(jiān)控大數(shù)據(jù)集群的相關(guān)知識。
　　3．分享多個來自一線的實(shí)例，有很強(qiáng)的實(shí)用性　　本書精心挑選了多個實(shí)用性很強(qiáng)的例子，如Hadoop套件實(shí)戰(zhàn)、Hive編程、Hadoop平臺管理與維護(hù)、ELK實(shí)戰(zhàn)和Kafka實(shí)戰(zhàn)等。讀者不但可以從這些例子中學(xué)習(xí)和理解Hadoop及其套件的相關(guān)知識點(diǎn)，而且還可以將這些例子應(yīng)用于實(shí)際開發(fā)中。
　　4．講解通俗易懂，力爭觸類旁通，舉一反三　　本書用通俗易懂的語言講解，避免云山霧罩，讓讀者不知所云。書中在講解一些常用知識點(diǎn)時將Hadoop命令與Linux命令進(jìn)行了對比，便于熟悉Linux命令的讀者能夠迅速掌握Hadoop的操作命令。
本書內(nèi)容　　第1章集群及開發(fā)環(huán)境搭建　　本章介紹的主要內(nèi)容包括：環(huán)境準(zhǔn)備；安裝Hadoop；演示Hadoop版Hello World示例程序，以及搭建Hadoop開發(fā)環(huán)境。
　　第2章實(shí)戰(zhàn)：快速構(gòu)建一個Hadoop項(xiàng)目并線上運(yùn)行　　本章首先介紹了快速構(gòu)建項(xiàng)目工程的方法，如Maven和Java Project；然后介紹了分布式文件系統(tǒng)的操作命令，以及利用IDE提交MapReduce作業(yè)的相關(guān)知識；最后介紹了編譯應(yīng)用程序并打包，以及部署與調(diào)度等內(nèi)容。
　　第3章 Hadoop套件實(shí)戰(zhàn)　　本章介紹了Hadoop生態(tài)圈中常見的大數(shù)據(jù)套件的背景知識和使用方法，涵蓋Sqoop、Flume、HBase、Zeppelin、Drill及Spark等套件。
　　第4章 Hive編程使用SQL提交MapReduce任務(wù)到Hadoop集群　　本章主要介紹了Hive數(shù)據(jù)倉庫的相關(guān)內(nèi)容：Hive底層設(shè)計組成；安裝和配置Hive；基于Hive應(yīng)用接口進(jìn)行編程；開源監(jiān)控工具Hive Cube。
　　第5章游戲玩家的用戶行為分析特征提取　　本章首先對Hadoop的基礎(chǔ)知識進(jìn)行了梳理；然后介紹了項(xiàng)目的背景和平臺架構(gòu)；接著對項(xiàng)目進(jìn)行了整體分析與指標(biāo)設(shè)計，并進(jìn)行了技術(shù)選型；最后對分析的指標(biāo)進(jìn)行了編碼實(shí)踐。
　　第6章 Hadoop平臺管理與維護(hù)　　本章介紹了Hadoop平臺管理與維護(hù)的重要方法。本章首先介紹了Hadoop分布式文件系統(tǒng)的特性，然后介紹了HDFS的基礎(chǔ)命令，并對NameNode進(jìn)行了解讀。另外，本章對Hadoop平臺維護(hù)時的常規(guī)操作，如節(jié)點(diǎn)管理、HDFS快照和安全模式等內(nèi)容也進(jìn)行了講解。
　　第7章 Hadoop異常處理解決方案　　本章介紹了Hadoop異常處理解決方案的幾個知識點(diǎn)。主要內(nèi)容包括：跟蹤日志；分析異常信息；利用搜索引擎檢索關(guān)鍵字；查看Hadoop JIRA；閱讀Hadoop源代碼。
　　本章最后以實(shí)戰(zhàn)案例的形式分析了幾種異常情況：啟動HBase集群失��；HBase表查詢失��；Spark的臨時數(shù)據(jù)不自動清理等。
　　第8章初識Hadoop核心源碼　　本章首先介紹了Hadoop源碼基礎(chǔ)環(huán)境準(zhǔn)備及源代碼編譯；接著介紹了Hadoop的起源和兩代MapReduce框架間的差異；最后介紹了Hadoop的序列化機(jī)制。
　　第9章 Hadoop通信機(jī)制和內(nèi)部協(xié)議　　本章首先介紹了Hadoop通信模型和Hadoop RPC的特點(diǎn)；然后通過編碼實(shí)踐介紹了Hadoop RPC的使用，同時還介紹了與之類似的開源RPC框架；最后介紹了MapReduce的通信協(xié)議和RPC協(xié)議的實(shí)現(xiàn)過程。
　　第10章 Hadoop分布式文件系統(tǒng)剖析　　本章主要介紹了Hadoop分布式文件系統(tǒng)的設(shè)計特點(diǎn)、命令空間和節(jié)點(diǎn)、數(shù)據(jù)備份策略

你還可能感興趣

我要評論