關于我們
書單推薦
新書推薦

Python和PySpark數據分析

Python和PySpark數據分析

定  價:118 元

叢書名:數據科學與大數據技術

        

  • 作者:[加]喬納森·里烏(JonathanRioux)著殷海英譯
  • 出版時間:2023/10/1
  • ISBN:9787302645368
  • 出 版 社:清華大學出版社
  • 中圖法分類:TP274 
  • 頁碼:
  • 紙張:膠版紙
  • 版次:
  • 開本:16開
9
7
6
8
4
7
5
3
3
0
6
2
8

Spark數據處理引擎是一個驚人的分析工廠:輸入原始數據,輸出洞察。PySpark用基于Python的API封裝了Spark的核心引擎。它有助于簡化Spark陡峭的學習曲線,并使這個強大的工具可供任何在Python數據生態(tài)系統(tǒng)中工作的人使用。 《Python和PySpark數據分析》幫助你使用PySpark解決數據科學的日常挑戰(zhàn)。你將學習如何跨多臺機器擴展處理能力,同時從任何來源(無論是Hadoop集群、云數據存儲還是本地數據文件)獲取數據。一旦掌握了基礎知識,就可以通過構建機器學習管道,并配合Python、pandas和PySpark代碼,探索PySpark的全面多功能特性。 主要內容 ● 組織PySpark代碼 ● 管理任何規(guī)模的數據 ● 充滿信心地擴展你的數據項目 ● 解決常見的數據管道問題 ● 創(chuàng)建可靠的長時間運行的任務

 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內容