關(guān)于我們
書單推薦
新書推薦
|
Spark原理深入與編程實(shí)戰(zhàn)(微課視頻版)
本書系統(tǒng)講述Apache Spark大數(shù)據(jù)計(jì)算平臺(tái)的原理,以及如果將Apache Spark應(yīng)用于大數(shù)據(jù)的實(shí)時(shí)流處理、批處理、圖計(jì)算等各個(gè)場景。通過原理深入學(xué)習(xí)和實(shí)踐示例、案例的學(xué)習(xí)應(yīng)用,使讀者了解并掌握Apache Spark大數(shù)據(jù)計(jì)算平臺(tái)的基本原理和技能,接近理論與實(shí)踐的距離。
全書共分為13章,主要內(nèi)容包括Spark架構(gòu)原理與集群搭建、開發(fā)和部署Spark應(yīng)用程序、Spark核心編程、Spark SQL、Spark SQL高級(jí)分析、Spark Streaming流處理、Spark結(jié)構(gòu)化流、Spark結(jié)構(gòu)化流高級(jí)處理、下一代Spark圖處理庫GraphFrames、下一代大數(shù)據(jù)技術(shù)(Delta Lake數(shù)據(jù)湖、Iceberg數(shù)據(jù)湖和Hudi數(shù)據(jù)湖)、Spark大數(shù)據(jù)處理綜合案例。本書源碼全部在Apache Spark 3.1.2上調(diào)試成功,所有示例和案例均基于Scala語言。 為降低讀者學(xué)習(xí)大數(shù)據(jù)技術(shù)的門檻,本書除了提供了豐富的上機(jī)實(shí)踐操作和范例程序詳細(xì)講解之外,本書作者還為購買和使用本書的讀者提供了搭建好的Hadoop、Hive數(shù)倉和Spark大數(shù)據(jù)開發(fā)和學(xué)習(xí)環(huán)境。讀者既可以參照本書的講解自行搭建Hadoop和Spark環(huán)境,也可直接使用作者提供的開始和學(xué)習(xí)環(huán)境,快速開始大數(shù)據(jù)和Spark、數(shù)據(jù)湖的學(xué)習(xí)。 本書系統(tǒng)講解了Apache Spark大數(shù)據(jù)計(jì)算平臺(tái)的原理和流、批處理的開發(fā)實(shí)踐,內(nèi)容全面、實(shí)例豐富、可操作性強(qiáng),做到了理論與實(shí)踐相結(jié)合。本書適合大數(shù)據(jù)學(xué)習(xí)愛好者、想要入門Apache Spark的讀者作為入門和提高的技術(shù)參考書,也適合用作大中專院校大數(shù)據(jù)專業(yè)相關(guān)的學(xué)生和老師的教材或教學(xué)參考書。
你還可能感興趣
我要評(píng)論
|