數(shù)據(jù)采集技術(shù)(中級(jí))
定 價(jià):39 元
叢書名:1 X職業(yè)技能等級(jí)證書(數(shù)據(jù)采集)配套教材
- 作者:穆建平 陳天真
- 出版時(shí)間:2021/7/1
- ISBN:9787111684145
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類:TP274
- 頁(yè)碼:
- 紙張:膠版紙
- 版次:
- 開(kāi)本:16開(kāi)
本書為1 X職業(yè)技能等級(jí)證書(數(shù)據(jù)采集)配套教材,內(nèi)容涵蓋1 X《數(shù)據(jù)采集職業(yè)技能等級(jí)標(biāo)準(zhǔn)》規(guī)定的技能要求。
本書以項(xiàng)目任務(wù)驅(qū)動(dòng),圍繞企業(yè)級(jí)應(yīng)用進(jìn)行項(xiàng)目任務(wù)設(shè)計(jì),講解了不同類型數(shù)據(jù)采集的實(shí)現(xiàn),全書共6個(gè)項(xiàng)目,包括Scrapy框架網(wǎng)頁(yè)數(shù)據(jù)采集、Windows操作系統(tǒng)數(shù)據(jù)采集、Linux基本操作、Apache容器數(shù)據(jù)采集、Tomcat容器數(shù)據(jù)采集和JavaScript埋點(diǎn)式數(shù)據(jù)采集。本書理論和實(shí)踐相結(jié)合,由淺入深,內(nèi)容實(shí)用,可操作性強(qiáng)。
本書適用于1 X數(shù)據(jù)采集職業(yè)技能等級(jí)證書培訓(xùn),也可以作為各類職業(yè)院校大數(shù)據(jù)及相關(guān)專業(yè)的教材,還可作為數(shù)據(jù)采集從業(yè)人員的參考用書。
本書配有電子課件等教學(xué)資源,教師可登錄機(jī)械工業(yè)出版社教育服務(wù)網(wǎng)(www.cmpedu.com)注冊(cè)后免費(fèi)下載,或聯(lián)系編輯(010-88379807)咨詢。
前 言
· III ·
在數(shù)據(jù)飛速增長(zhǎng)的今天,數(shù)據(jù)產(chǎn)生的路徑也多種多樣,如網(wǎng)頁(yè)數(shù)據(jù)、客戶端APP數(shù)據(jù)、
操作系統(tǒng)數(shù)據(jù)、服務(wù)容器數(shù)據(jù)等,如何快速、準(zhǔn)確地采集這些數(shù)據(jù)成為開(kāi)發(fā)人員必須面對(duì)
的問(wèn)題。不管是大數(shù)據(jù)、云計(jì)算還是人工智能技術(shù)的實(shí)現(xiàn)都離不開(kāi)數(shù)據(jù),都需要以數(shù)據(jù)為支
撐,因此數(shù)據(jù)采集技術(shù)應(yīng)運(yùn)而生。數(shù)據(jù)采集人員可以根據(jù)數(shù)據(jù)來(lái)源的不同,選擇合適的技術(shù)
來(lái)實(shí)現(xiàn)海量數(shù)據(jù)的高效采集。
本書為數(shù)據(jù)采集的實(shí)現(xiàn)提供技術(shù)指導(dǎo),可幫助開(kāi)發(fā)人員快速實(shí)現(xiàn)不同類型數(shù)據(jù)的采集。
本書的特點(diǎn)
本書以不同類型數(shù)據(jù)采集的實(shí)現(xiàn)為主線,通過(guò)理論與實(shí)踐相結(jié)合的方式,詳細(xì)地對(duì)數(shù)據(jù)采
集技術(shù)的使用進(jìn)行講解,涉及多個(gè)數(shù)據(jù)采集技術(shù),主要包含Scrapy網(wǎng)絡(luò)爬蟲技術(shù)、Windows操
作系統(tǒng)數(shù)據(jù)采集技術(shù)、Apache容器和Tomcat容器數(shù)據(jù)采集技術(shù)、JavaScript埋點(diǎn)式數(shù)據(jù)采集技術(shù)
等,在提高實(shí)際開(kāi)發(fā)水平和項(xiàng)目能力的同時(shí),加深對(duì)理論知識(shí)的掌握。全書知識(shí)點(diǎn)講解詳細(xì),
在便于教師教學(xué)、學(xué)生理解的同時(shí),還保持了整本書的知識(shí)深度。
本書結(jié)構(gòu)條理清晰、內(nèi)容詳細(xì),每個(gè)項(xiàng)目都通過(guò)項(xiàng)目情景、學(xué)習(xí)目標(biāo)、任務(wù)描述、任務(wù)
步驟、知識(shí)儲(chǔ)備、拓展任務(wù)、任務(wù)總體評(píng)價(jià)和練習(xí)題8個(gè)模塊進(jìn)行相應(yīng)知識(shí)的講解。其中,項(xiàng)
目情景通過(guò)實(shí)際情景對(duì)本項(xiàng)目學(xué)習(xí)的主要內(nèi)容進(jìn)行講解,學(xué)習(xí)目標(biāo)對(duì)本項(xiàng)目?jī)?nèi)容的學(xué)習(xí)提出要
求、任務(wù)描述對(duì)當(dāng)前任務(wù)的實(shí)現(xiàn)進(jìn)行概述,任務(wù)步驟對(duì)當(dāng)前任務(wù)進(jìn)行具體的實(shí)現(xiàn),知識(shí)儲(chǔ)備對(duì)
當(dāng)前項(xiàng)目所需知識(shí)進(jìn)行講解,拓展任務(wù)對(duì)當(dāng)前知識(shí)進(jìn)行補(bǔ)充,使學(xué)生全面掌控所講內(nèi)容。
本書的主要內(nèi)容
本書共6個(gè)項(xiàng)目。
項(xiàng)目1從網(wǎng)頁(yè)數(shù)據(jù)采集開(kāi)始,分別講述了Scrapy的安裝、項(xiàng)目結(jié)構(gòu)、采集流程以及操作命
令使用、Spider和Selectors編寫、數(shù)據(jù)保存等。
項(xiàng)目2詳細(xì)介紹了Windows操作系統(tǒng)數(shù)據(jù)采集的過(guò)程,包含操作系統(tǒng)結(jié)構(gòu)、進(jìn)程及進(jìn)程管
理、資源分配與調(diào)度、設(shè)備管理、文件管理系統(tǒng)、Windows的種類與應(yīng)用、Windows的Shell腳
本以及Windows用戶的日志數(shù)據(jù)拆分。
項(xiàng)目3詳細(xì)介紹了Linux基本操作,包括Linux發(fā)展史、Linux在各領(lǐng)域的發(fā)展、Linux常見(jiàn)發(fā)
行版、用戶操作、目錄操作、文件操作以及Linux的Shell腳本等。
項(xiàng)目4詳細(xì)介紹了Apache容器數(shù)據(jù)采集,包括中間件容器的概述、Apache的歷史與發(fā)展、
Apache的管理與使用以及Apache日志文件等。
項(xiàng)目5詳細(xì)介紹了Tomcat容器數(shù)據(jù)采集,包括Tomcat的應(yīng)用和Linux下查看Tomcat狀態(tài)和日志。
PREFACE
· IV ·
項(xiàng)目6詳細(xì)介紹了JavaScript埋點(diǎn)式數(shù)據(jù)采集,包括JavaScript埋點(diǎn)式數(shù)據(jù)采集的意義、埋點(diǎn)
技術(shù)分析以及埋點(diǎn)實(shí)現(xiàn)方案等。
教學(xué)建議
項(xiàng) 目操作學(xué)時(shí)理論學(xué)時(shí)
項(xiàng)目1 Scrapy框架網(wǎng)頁(yè)數(shù)據(jù)采集4 4
項(xiàng)目2 Windows操作系統(tǒng)數(shù)據(jù)采集4 4
項(xiàng)目3 Linux基本操作4 4
項(xiàng)目4 Apache容器數(shù)據(jù)采集4 4
項(xiàng)目5 Tomcat容器數(shù)據(jù)采集4 4
項(xiàng)目6 JavaScript埋點(diǎn)式數(shù)據(jù)采集4 4
本書由浪潮優(yōu)派科技教育有限公司組編,由穆建平、陳天真任主編,宋磊、許國(guó)彬、劉濤
任副主編,參與編寫的還有李海斌、王緒良、商程。
由于編者水平有限,書中難免出現(xiàn)疏漏或不足之處,懇請(qǐng)讀者批評(píng)指正。
編 者
目 錄
前言
二維碼索引
項(xiàng)目1
Scrapy框架網(wǎng)頁(yè)數(shù)據(jù)采集 1
任務(wù)1 安裝Scrapy 2
任務(wù)2 Scrapy框架網(wǎng)頁(yè)數(shù)據(jù)采集 7
任務(wù)總體評(píng)價(jià) 24
練習(xí)題 24
項(xiàng)目2
Windows操作系統(tǒng)數(shù)據(jù)采集 27
任務(wù)1 Windows數(shù)據(jù)收集器的
使用 28
任務(wù)2 Windows日志數(shù)據(jù)采集 37
任務(wù)總體評(píng)價(jià) 48
練習(xí)題 49
項(xiàng)目3
Linux基本操作 51
任務(wù)1 Linux環(huán)境安裝 52
任務(wù)2 Linux常見(jiàn)命令操作 70
任務(wù)總體評(píng)價(jià) 85
練習(xí)題 85
項(xiàng)目4
Apache容器數(shù)據(jù)采集 87
任務(wù)1 Linux下Apache的安裝 88
任務(wù)2 Linux下Apache容器數(shù)據(jù)
采集 92
任務(wù)3 Linux下Apache日志
分析與查看 105
任務(wù)4 Windows下Apache容器
數(shù)據(jù)采集 116
任務(wù)總體評(píng)價(jià) 128
練習(xí)題 128
項(xiàng)目5
Tomcat容器數(shù)據(jù)采集 131
任務(wù)1 Tomcat安裝 132
任務(wù)2 Tomcat日志配置遠(yuǎn)程
rsyslog采集 140
任務(wù)3 Linux下Tomcat日志
數(shù)據(jù)采集 150
任務(wù)總體評(píng)價(jià) 159
練習(xí)題 159
項(xiàng)目6
JavaScript埋點(diǎn)式數(shù)據(jù)采集 161
任務(wù)1 初識(shí)JavaScript埋點(diǎn)式數(shù)據(jù)
采集 162
任務(wù)2 JavaScript埋點(diǎn)采集用戶
網(wǎng)頁(yè)瀏覽日志 173
任務(wù)總體評(píng)價(jià) 184
練習(xí)題 184
參考文獻(xiàn) 186