本書結合了一線大數(shù)據(jù)企業(yè)在商務數(shù)據(jù)上的采集和應用方式,從數(shù)據(jù)基礎、數(shù)據(jù)來源、數(shù)據(jù)采集到數(shù)據(jù)處理等方面展開內容講解。 本書融入了大量的實操案例,對學習目標進行詳細講解,反復強化理論圍繞實操,實操深化理論,真實掌握技能的教學理念,希望能為讀者提供有效幫助。
1、產(chǎn)教融合教材,為我社、浙江商業(yè)職業(yè)技術學院與八爪魚公司合作開發(fā) 2、配套資源豐富,配套教案、ppt、教學大綱、視頻和八爪魚免費試用軟件 3、融入了大量的實操案例,,從數(shù)據(jù)基礎、數(shù)據(jù)來源、數(shù)據(jù)采集到數(shù)據(jù)處理等方面展開內容講解
劉寶強 深圳視界信息技術有限公司,是一家以打造大數(shù)據(jù)平臺為目標,致力于提供大數(shù)據(jù)軟件與行業(yè)解決方案的國家高新企業(yè)。公司旗下有2個品牌:八爪魚大數(shù)據(jù)采集平臺、云聽CEM客戶管理體驗平臺
第 1章 商務數(shù)據(jù)采集概述 1
1.1 初識數(shù)據(jù) 1
1.2 商務數(shù)據(jù)的涵義 6
1.3 商務數(shù)據(jù)來源與采集 9
第 2章 商務數(shù)據(jù)采集工具及應用 23
2.1 商務數(shù)據(jù)采集工具介紹 23
2.2 爬蟲軟件在商務數(shù)據(jù)分析中的應用 24
2.3 python爬蟲在商務數(shù)據(jù)采集中的應用 30
第3章 數(shù)據(jù)采集方法與采集器 38
3.1 初識數(shù)據(jù)采集器 38
3.2 數(shù)據(jù)采集器的安裝與界面 40
第4章 數(shù)據(jù)采集器應用 48
4.1 簡易模式及實例 48
4.2 向導模式及實例 49
4.3 自定義采集模式 55
第5章 數(shù)據(jù)采集器高級應用 70
5.1 屏蔽網(wǎng)頁廣告 70
5.2 切換瀏覽器版本 70
5.3 禁止加載圖片 71
5.4 增量采集 71
5.5 智能防封 73
5.6 登錄采集 75
5.7 網(wǎng)頁源碼提取 78
5.8 圖片、附件采集與下載 79
5.9 循環(huán)切換下拉框 80
5.10 移動鼠標到元素上 81
第6章 數(shù)據(jù)采集器定位方式及云采集 83
6.1 XPath數(shù)據(jù)定位 83
6.2 云采集 96
第7章 數(shù)據(jù)采集器采集實例 103
7.1 數(shù)據(jù)采集器應用領域 103
7.2 金融網(wǎng)站的數(shù)據(jù)采集 104
7.3 新聞網(wǎng)站的數(shù)據(jù)采集 109
7.4 職場招聘的數(shù)據(jù)采集 112
7.5 店鋪位置的數(shù)據(jù)采集 116
7.6 競品數(shù)據(jù)的采集 118
7.7 企業(yè)產(chǎn)品相關評論的采集 124
7.8 營銷推廣的數(shù)據(jù)采集 132
第8章 數(shù)據(jù)處理 138
8.1 數(shù)據(jù)清洗 138
8.2 數(shù)據(jù)加工 146