大數(shù)據(jù)處理技術(shù)及案例應(yīng)用
定 價(jià):39.8 元
叢書名:普通高等教育人工智能與大數(shù)據(jù)系列教材
- 作者:張道海 袁雪梅 李丹丹 樊茗玥
- 出版時(shí)間:2022/6/1
- ISBN:9787111705048
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類:TP274
- 頁碼:178
- 紙張:
- 版次:
- 開本:16
隨著云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能和區(qū)塊鏈等IT 技術(shù)的發(fā)展與應(yīng)用,信息技術(shù)不斷驅(qū)動(dòng)社會生產(chǎn)方式的變革,人類進(jìn)入機(jī)器智能時(shí)代。近年來,大數(shù)據(jù)處理技術(shù)已經(jīng)廣泛地滲透到各行各業(yè),大數(shù)據(jù)分析與應(yīng)用的教學(xué)工作也逐漸成為高校中的重中之重,這是大數(shù)據(jù)時(shí)代下的必然趨勢。
本書從實(shí)際應(yīng)用出發(fā),結(jié)合具體案例及應(yīng)用場景,深入淺出地介紹大數(shù)據(jù)處理預(yù)備知識、Python 技術(shù)基礎(chǔ)、大數(shù)據(jù)處理常用模塊、大數(shù)據(jù)采集技術(shù)、大數(shù)據(jù)處理算法以及文本挖掘與應(yīng)用等。從環(huán)境搭建到數(shù)據(jù)采集可視化,從數(shù)據(jù)預(yù)處理到特征選擇與模型訓(xùn)練,再從模型調(diào)優(yōu)到測試評估。通過本書,讀者可掌握大數(shù)據(jù)處理中必備的知識體系和技能,在各領(lǐng)域開展大數(shù)據(jù)處理與研究工作。本書實(shí)例短小精練,便于學(xué)習(xí),讀者能夠在短時(shí)間內(nèi)掌握相關(guān)知識點(diǎn)及其應(yīng)用。
本書主要面向高等學(xué)校從事大數(shù)據(jù)處理和分析的本科生和研究生,亦可作為高等學(xué)校大數(shù)據(jù)處理相關(guān)課程的教材。此外,本書提供配套的軟件包、實(shí)例代碼和數(shù)據(jù)文件,歡迎使用本書作為教材的老師登錄www.cmpedu.com 進(jìn)行下載。
第1 章 大數(shù)據(jù)處理預(yù)備知識.1
1.1 人類的驕傲 1
1.2 大數(shù)據(jù)思維 1
1.3 大數(shù)據(jù)的關(guān)鍵技術(shù) 2
1.4 機(jī)器學(xué)習(xí) 3
1.5 訓(xùn)練集與測試集 4
1.6 特征表示 4
1.7 文檔的相似度計(jì)算 5
1.8 貝葉斯定理 6
1.9 信息熵 7
1.10 正確率、精確率與召回率 7
1.11 ROC 曲線 .8
1.12 大數(shù)據(jù)隱私與安全 9
1.13 練習(xí) 10
第2 章 Python 技術(shù)基礎(chǔ)11
2.1 Python 開發(fā)環(huán)境的搭建11
2.2 常用操作符 12
2.3 語句規(guī)范 13
2.4 變量與數(shù)據(jù) 13
2.5 控制語句 14
2.6 數(shù)據(jù)結(jié)構(gòu) 16
2.7 函數(shù) 21
2.8 可變對象與不可變對象 23
2.9 面向?qū)ο蟪绦蛟O(shè)計(jì) 24
2.10 練習(xí) 31第3 章 大數(shù)據(jù)處理常用模塊.32
3.1 NumPy 32
3.2 Pandas.36
3.3 Matplotlib .41
3.4 練習(xí) 50第4 章 大數(shù)據(jù)采集技術(shù) 53
4.1 網(wǎng)絡(luò)爬蟲概述 53
4.2 Requests 基礎(chǔ).54
4.3 XPath 與Lxml57
4.4 網(wǎng)頁采集 60
4.5 分頁采集 61
4.6 練習(xí) 63第5 章 大數(shù)據(jù)處理算法及應(yīng)用 64
5.1 回歸 64
5.2 決策樹 73
5.3 K 近鄰.80
5.4 支持向量機(jī) 84
5.5 神經(jīng)網(wǎng)絡(luò) 87
5.6 樸素貝葉斯 91
5.7 聚類 94
5.8 關(guān)聯(lián)規(guī)則 98
5.9 PCA 降維 .102
5.10 機(jī)器學(xué)習(xí)流程 106
5.11 練習(xí) 118
第6 章 文本挖掘與應(yīng)用 121
6.1 文本挖掘流程 121
6.2 NLTK121
6.3 TextBlob .130
6.4 Jieba134
6.5 SnowNLP139
6.6 正則表達(dá)式 ..143
6.7 詞云 150
6.8 LDA 主題模型 .152
6.9 練習(xí) 156第7 章 大數(shù)據(jù)應(yīng)用案例 157
7.1 泰坦尼克生存預(yù)測 157
7.2 基于用戶評論的智能音箱市場分析 166
7.3 有事找政府12345 .171
7.4 基于網(wǎng)貸評論的用戶輿情挖掘 172參考文獻(xiàn).178