關于我們
書單推薦
新書推薦

網(wǎng)絡數(shù)據(jù)爬取與分析實務

網(wǎng)絡數(shù)據(jù)爬取與分析實務

定  價:68 元

        

  • 作者:李周平 著
  • 出版時間:2018/9/1
  • ISBN:9787313200327
  • 出 版 社:上海交通大學出版社
  • 中圖法分類:TP311.561 
  • 頁碼:
  • 紙張:特種紙
  • 版次:1
  • 開本:16開
9
7
2
8
0
7
0
3
3
1
2
3
7

本書按照網(wǎng)絡數(shù)據(jù)爬取、數(shù)據(jù)清洗與處理、數(shù)據(jù)存儲、數(shù)據(jù)分析的邏輯脈絡,介紹了數(shù)據(jù)科學的相關知識。

全書主要內(nèi)容涉及理論、實戰(zhàn)、工具三個層面。其中,理論層面主要介紹了網(wǎng)絡爬蟲,數(shù)據(jù)處理與存儲,機器學習的相關概念、原理與算法;實戰(zhàn)層面主要通過影評、二手房、招聘網(wǎng)站等實戰(zhàn)項目,闡述了數(shù)據(jù)爬取、處理與存儲的代碼實現(xiàn),并通過相關數(shù)據(jù)集的實例,介紹了機器學習算法的實現(xiàn)與效果評估;工具層面主要講解了如何通過Python的Urllib、Request、BeautifulSoup、Pandas、Scikit-learn等第三方工具包實現(xiàn)數(shù)據(jù)的爬取、處理與分析,以及通過SQLite這一輕量級數(shù)據(jù)庫工具實現(xiàn)數(shù)據(jù)的存儲。


 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內(nèi)容