關(guān)于我們
書(shū)單推薦
新書(shū)推薦

Python大數(shù)據(jù)處理庫(kù)PySpark實(shí)戰(zhàn)

Python大數(shù)據(jù)處理庫(kù)PySpark實(shí)戰(zhàn)

定  價(jià):79 元

        

  • 作者:汪明
  • 出版時(shí)間:2021/3/1
  • ISBN:9787302575085
  • 出 版 社:清華大學(xué)出版社
  • 中圖法分類(lèi):TP274 
  • 頁(yè)碼:320
  • 紙張:
  • 版次:1
  • 開(kāi)本:
9
7
5
8
7
7
5
3
0
0
8
2
5
我國(guó)提出新基建概念,要加快大數(shù)據(jù)中心、人工智能等新型基礎(chǔ)設(shè)施的建設(shè)進(jìn)度,這無(wú)疑需要更多的大數(shù)據(jù)人才。PySpark可以對(duì)大數(shù)據(jù)進(jìn)行分布式處理,降低大數(shù)據(jù)學(xué)習(xí)門(mén)檻,本書(shū)正是一本PySpark入門(mén)教材,適合有一定Python基礎(chǔ)的讀者學(xué)習(xí)使用。
本書(shū)分為7章,第1章介紹大數(shù)據(jù)的基本概念、常用的大數(shù)據(jù)分析工具;第2章介紹Spark作為大數(shù)據(jù)處理的特點(diǎn)和算法;第3章介紹Spark實(shí)戰(zhàn)環(huán)境的搭建,涉及Windows和Linux操作系統(tǒng);第4章介紹如何靈活應(yīng)用PySpark對(duì)數(shù)據(jù)進(jìn)行操作;第5章介紹PySpark ETL處理,涉及PySpark讀取數(shù)據(jù)、對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析等數(shù)據(jù)處理相關(guān)內(nèi)容;第6章介紹PySpark如何利用MLlib庫(kù)進(jìn)行分布式機(jī)器學(xué)習(xí)(Titanic幸存者預(yù)測(cè));第7章介紹一個(gè)PySpark和Kafka結(jié)合的實(shí)時(shí)項(xiàng)目。
本書(shū)內(nèi)容全面、示例豐富,可作為廣大PySpark入門(mén)讀者必備的參考書(shū),同時(shí)能作為大中專(zhuān)院校師生的教學(xué)參考書(shū),也可作為高等院校計(jì)算機(jī)及相關(guān)專(zhuān)業(yè)的大數(shù)據(jù)技術(shù)教材使用。
 你還可能感興趣
 我要評(píng)論
您的姓名   驗(yàn)證碼: 圖片看不清?點(diǎn)擊重新得到驗(yàn)證碼
留言?xún)?nèi)容