Hadoop理論與實(shí)踐/大數(shù)據(jù)人工智能系列叢書(shū)
定 價(jià):58 元
叢書(shū)名:大數(shù)據(jù)人工智能系列叢書(shū)
- 作者:李平 著,北京百里半網(wǎng)絡(luò)技術(shù)有限公司 編
- 出版時(shí)間:2021/1/1
- ISBN:9787302559504
- 出 版 社:清華大學(xué)出版社
- 中圖法分類(lèi):TP274
- 頁(yè)碼:217
- 紙張:膠版紙
- 版次:1
- 開(kāi)本:16開(kāi)
《Hadoop理論與實(shí)踐/大數(shù)據(jù)人工智能系列叢書(shū)》按照高等學(xué)校大數(shù)據(jù)、人工智能課程基本要求,以案例驅(qū)動(dòng)的形式來(lái)組織內(nèi)容,突出該課程的實(shí)踐性特點(diǎn)。
《Hadoop理論與實(shí)踐/大數(shù)據(jù)人工智能系列叢書(shū)》主要包含四大部分:Hadoop技術(shù)、數(shù)據(jù)倉(cāng)庫(kù)與Hive、Flume分布式日志處理系統(tǒng)、Spark及其生態(tài)圈概述。其中,Hadoop技術(shù)包括大數(shù)據(jù)與數(shù)據(jù)分析、Hadoop生態(tài)系統(tǒng)介紹、Hadoop存儲(chǔ)、Hadoop計(jì)算之MapReduce、Hadoop安全等;數(shù)據(jù)倉(cāng)庫(kù)與Hive包括Hive與數(shù)據(jù)庫(kù)的基礎(chǔ)知識(shí)、Hive的高級(jí)特性、Hive優(yōu)化及案例的應(yīng)用;Flume分布式日志處理系統(tǒng)包括Flume介紹、Flume使用案例及Flume開(kāi)發(fā)案例的應(yīng)用;Spark及其生態(tài)圈概述包括Spark簡(jiǎn)介及Spark生態(tài)系統(tǒng)詳解。
《Hadoop理論與實(shí)踐/大數(shù)據(jù)人工智能系列叢書(shū)》內(nèi)容安排合理,層次清晰,通俗易懂,實(shí)例豐富,突出理論與實(shí)踐的結(jié)合,可作為各類(lèi)高等院校人工智能與大數(shù)據(jù)相關(guān)專(zhuān)業(yè)的教材,也可供廣大程序設(shè)計(jì)人員參考。
大數(shù)據(jù)是什么?在過(guò)去的十年間,恐怕沒(méi)有一個(gè)詞比大數(shù)據(jù)更高頻了,也沒(méi)有一個(gè)概念如大數(shù)據(jù)一樣,眾說(shuō)紛紜。2014年,阿里巴巴集團(tuán)總裁馬云提出,“人類(lèi)正從IT時(shí)代走向DT時(shí)代”。DT(data technology)時(shí)代,以服務(wù)大眾、激發(fā)生產(chǎn)力為主。以物聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)和人工智能為代表的新技術(shù)革命正在滲透至各行各業(yè),改變著我們的生活。
Hadoop是Apache軟件基金會(huì)下的一個(gè)頂級(jí)項(xiàng)目,它是目前大數(shù)據(jù)行業(yè)的基礎(chǔ)支撐。Hadoop改變了大數(shù)據(jù)的存儲(chǔ)、處理和分析的過(guò)程,強(qiáng)有力地驅(qū)動(dòng)了大數(shù)據(jù)行業(yè)的發(fā)展,形成了自己的生態(tài)圈。
本書(shū)對(duì)Hadoop的架構(gòu)、原理和生態(tài)系統(tǒng)組成進(jìn)行了詳細(xì)的解讀,結(jié)構(gòu)清晰,對(duì)于需要詳細(xì)了解和應(yīng)用Hadoop的讀者是一個(gè)不錯(cuò)的選擇。
本書(shū)是北京百里半網(wǎng)絡(luò)技術(shù)有限公司所編著的“大數(shù)據(jù)人工智能系列叢書(shū)”中的一本,它為該系列的其他幾本專(zhuān)業(yè)教材提供了大數(shù)據(jù)入門(mén)的支撐。
本書(shū)凝聚了編委會(huì)多年來(lái)的教學(xué)經(jīng)驗(yàn)和成果,內(nèi)容安排合理,層次清晰,通俗易懂,實(shí)例豐富,突出理論和實(shí)踐相結(jié)合,可作為各類(lèi)高等院校教材,也可供廣大程序設(shè)計(jì)人員參考。
本書(shū)由北京百里半網(wǎng)絡(luò)技術(shù)有限公司和李平老師編著。本書(shū)編者長(zhǎng)期從事項(xiàng)目開(kāi)發(fā)和教學(xué)實(shí)施,并且對(duì)當(dāng)前高校的教學(xué)情況非常熟悉,在編寫(xiě)過(guò)程中充分考慮到不同學(xué)生的特點(diǎn)和需求,加強(qiáng)了項(xiàng)目實(shí)戰(zhàn)方面的教學(xué)。在本書(shū)的編寫(xiě)過(guò)程中,得到了武漢厚溥教育科技有限公司各級(jí)領(lǐng)導(dǎo)的大力支持,在此對(duì)他們表示衷心的感謝。
北京百里半網(wǎng)絡(luò)技術(shù)有限公司,武漢厚溥企業(yè)集團(tuán)成員單位,致力于互聯(lián)網(wǎng)相關(guān)信息技術(shù)產(chǎn)品和服務(wù)的研究與開(kāi)發(fā),以及在線教育行業(yè)產(chǎn)品、服務(wù)的集成運(yùn)營(yíng)。公司擁有雄厚的具備學(xué)術(shù)、教育及產(chǎn)業(yè)背景的研發(fā)團(tuán)隊(duì)。
公司為政府、高校、企業(yè)等提供極具競(jìng)爭(zhēng)力的產(chǎn)品服務(wù)。在人工智能、大數(shù)據(jù)及IT運(yùn)維、互聯(lián)網(wǎng)用戶(hù)行為分析、在線教育等領(lǐng)域推出了自有知識(shí)產(chǎn)權(quán)的獨(dú)特而領(lǐng)先的產(chǎn)品,為公司的持續(xù)發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)。
北京百里半網(wǎng)絡(luò)技術(shù)有限公司長(zhǎng)期以來(lái)堅(jiān)持并弘揚(yáng)“以人為本,本在心;以厚為道,道在行。創(chuàng)造機(jī)遇,成就潛能。IT成就**潛能”的企業(yè)文化,努力成為值得客戶(hù)信賴(lài)的、具有獨(dú)特價(jià)值的優(yōu)秀企業(yè),并使之基業(yè)長(zhǎng)青。
李平,男,1981年出生,工學(xué)博士,任教于黃岡師范學(xué)院數(shù)學(xué)與統(tǒng)計(jì)學(xué)院。主要研究方向?yàn)榇髷?shù)據(jù)技術(shù)與應(yīng)用、數(shù)學(xué)建模等,有豐富的高校教學(xué)經(jīng)驗(yàn)與企業(yè)實(shí)踐經(jīng)歷,發(fā)表科研論文十余篇,主持參與省部級(jí)科研項(xiàng)目三項(xiàng),多次指導(dǎo)本專(zhuān)科學(xué)生及研究生參加數(shù)據(jù)挖掘競(jìng)賽、數(shù)學(xué)建模競(jìng)賽并獲得***獎(jiǎng)項(xiàng)。
第1章 大數(shù)據(jù)概述
1.1 大數(shù)據(jù)與數(shù)據(jù)分析
1.1.1 Hadoop的基礎(chǔ)組件
1.1.2 Hadoop分布式文件系統(tǒng)
1.1.3 MapReduce
1.1.4 YARN
1.2 ZooKeeper
1.3 HiVe
1.4 與其他系統(tǒng)集成
1.4.1 Hadoop生態(tài)系統(tǒng)
1.4.2 數(shù)據(jù)集成與Hadoop
1.4.3 Hadoop商用平臺(tái)CDH
第2章 Hadoop存儲(chǔ)
2.1 HDFS的基礎(chǔ)知識(shí)
2.1.1 HDFS概念
2.1.2 架構(gòu)
2.1.3 接口
2.2 在分布式模式下設(shè)置HDFS集群
2.3 HDFS的高級(jí)特性
2.3.1 快照
2.3.2 離線查看器
2.3.3 分層存儲(chǔ)
2.4 文件格式
2.5 云存儲(chǔ)
第3章 數(shù)據(jù)倉(cāng)庫(kù)和Hive
3.1 數(shù)據(jù)倉(cāng)庫(kù)和Hive簡(jiǎn)介
3.1.1 數(shù)據(jù)倉(cāng)庫(kù)簡(jiǎn)介
3.1.2 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)庫(kù)的區(qū)別
3.1.3 Hive簡(jiǎn)介
3.1.4 查看CDH中Hive版本
3.2 Hive與數(shù)據(jù)庫(kù)
3.2.1 Hive與RDBMS
3.2.2 HiveQL與SQL
3.3 Hive的高級(jí)特性
3.3.1 Hive的優(yōu)缺點(diǎn)和適用場(chǎng)景
3.3.2 Hive進(jìn)程介紹
3.3.3 Hive訪問(wèn)方式
3.3.4 Hive體系結(jié)構(gòu)
3.3.5 HiveMetastore
3.3.6 Hive數(shù)據(jù)類(lèi)型
3.3.7 Hive的常用參數(shù)配置
3.3.8 Hive的數(shù)據(jù)模型
3.3.9 Hive函數(shù)
3.4 案例演示
3.4.1 準(zhǔn)備數(shù)據(jù)
3.4.2 修改和查詢(xún)
3.4.3 表連接
3.4.4 創(chuàng)建視圖
3.4.5 創(chuàng)建索引
3.4.6 JDBC開(kāi)發(fā)
3.4.7 UDF的開(kāi)發(fā)
3.4.8 UDAF
3.5 Hive優(yōu)化和Hive中的鎖
3.5.1 注意事項(xiàng)
3.5.2 Hive鎖
3.6 問(wèn)題匯總
……
第4章 Hadoop計(jì)算
第5章 Hadoop安全
第6章 Flume分布式日志處理系統(tǒng)
第7章 Spark及其生態(tài)圈概述