《大數(shù)據(jù)技術(shù)與應用》主要介紹大數(shù)據(jù)技術(shù)的基本概念與應用。全書共分10章,內(nèi)容包括大數(shù)據(jù)介紹、云計算與大數(shù)據(jù)、大數(shù)據(jù)架構(gòu)、數(shù)據(jù)采集與清洗、大數(shù)據(jù)存儲、大數(shù)據(jù)分析與挖掘、大數(shù)據(jù)可視化、大數(shù)據(jù)安全、大數(shù)據(jù)的行業(yè)應用以及大數(shù)據(jù)綜合實訓。本書注重理論與實踐操作相結(jié)合,通過大量的案例幫助讀者快速了解并掌握大數(shù)據(jù)相關(guān)技術(shù)。
《大數(shù)據(jù)技術(shù)與應用》既可作為高等職業(yè)院校大數(shù)據(jù)專業(yè)、軟件技術(shù)專業(yè)、信息管理專業(yè)、計算機網(wǎng)絡專業(yè)等計算機相關(guān)專業(yè)的專業(yè)課教材,也可作為對大數(shù)據(jù)感興趣的讀者的參考書。
前言
第1章 大數(shù)據(jù)介紹
1.1 大數(shù)據(jù)概述
1.1.1 認識大數(shù)據(jù)
1.1.2 大數(shù)據(jù)的特征
1.1.3 大數(shù)據(jù)技術(shù)應用與基礎(chǔ)
1.2 大數(shù)據(jù)的意義
1.2.1 大數(shù)據(jù)的國家戰(zhàn)略意義
1.2.2 大數(shù)據(jù)的企業(yè)意義
1.2.3 我國大數(shù)據(jù)市場的預測
1.3 大數(shù)據(jù)的產(chǎn)業(yè)鏈分析
1.3.1 技術(shù)分析
1.3.2 運營分析
1.4 實訓1 用百度指數(shù)進行大數(shù)據(jù)分析
1.5 實訓2 確定數(shù)據(jù)的不同類型
本章小結(jié)
習題1
第2章 云計算與大數(shù)據(jù)
2.1 云計算概述
2.1.1 云計算定義
2.1.2 云計算特征
2.1.3 云計算體系
2.2 云計算的服務類型
2.2.1 IaaS(基礎(chǔ)設施即服務)
2.2.2 PaaS(平臺即服務)
2.2.3 SaaS(軟件即服務)
2.3 云計算的關(guān)鍵技術(shù)
2.3.1 虛擬化技術(shù)
2.3.2 并行計算技術(shù)
2.3.3 分布式存儲技術(shù)
2.4 云計算與大數(shù)據(jù)
2.4.1 云計算與大數(shù)據(jù)的關(guān)系
2.4.2 云計算與大數(shù)據(jù)的結(jié)合
2.4.3 云計算的應用
本章小結(jié)
習題2
第3章 大數(shù)據(jù)架構(gòu)
3.1 大數(shù)據(jù)架構(gòu)概述
3.1.1 大數(shù)據(jù)架構(gòu)介紹
3.1.2 大數(shù)據(jù)架構(gòu)分類
3.2 Hadoop架構(gòu)
3.2.1 Hadoop介紹
3.2.2 Hadoop發(fā)展史
3.2.3 Hadoop核心組件
3.3 HDFS概述
3.3.1 HDFS的概念
3.3.2 HDFS的操作
3.4 MapReduce概述
3.4.1 MapReduce的概念
3.4.2 MapReduce設計方式
3.4.3 MapReduce架構(gòu)
3.5 實訓1 Hadoop搭建
3.6 實訓2 MapReduce應用
本章小結(jié)
習題3
第4章 數(shù)據(jù)采集與清洗
4.1 數(shù)據(jù)采集
4.1.1 數(shù)據(jù)采集介紹
4.1.2 數(shù)據(jù)采集平臺
4.1.3 網(wǎng)絡數(shù)據(jù)的采集
4.2 數(shù)據(jù)清洗
4.2.1 數(shù)據(jù)清洗概述
4.2.2 數(shù)據(jù)清洗的流程
4.2.3 數(shù)據(jù)清洗的常用方法
4.2.4 數(shù)據(jù)標準化概述
4.2.5 數(shù)據(jù)標準化的實例
4.3 數(shù)據(jù)倉庫概述
4.3.1 數(shù)據(jù)倉庫介紹
4.3.2 數(shù)據(jù)集成
4.3.3 數(shù)據(jù)變換
4.3.4 數(shù)據(jù)倉庫的構(gòu)建工具
4.4 Kettle工具概述
4.5 實訓1 使用八爪魚軟件進行網(wǎng)絡數(shù)據(jù)的采集
4.6 實訓2 清洗Excel數(shù)據(jù)
4.7 實訓3 清洗異常數(shù)據(jù)
4.8 實訓4 使用Kettle工具進行數(shù)據(jù)排序
本章小結(jié)
習題4
第5章 大數(shù)據(jù)存儲
5.1 大數(shù)據(jù)存儲概述
5.1.1 大數(shù)據(jù)存儲的概念
5.1.2 大數(shù)據(jù)存儲的類型
5.2 大數(shù)據(jù)存儲的方式
5.2.1 分布式存儲
5.2.2 NoSQL數(shù)據(jù)庫存儲
5.2.3 NewSQL數(shù)據(jù)庫存儲
5.2.4 云數(shù)據(jù)庫存儲
5.3 大數(shù)據(jù)中的數(shù)據(jù)庫應用
5.3.1 MySQL
5.3.2 Hive
5.3.3 MongoDB
5.3.4 LevelDB
5.3.5 Neo4j
5.4 實訓 查看和購買阿里云RDS服務
本章小結(jié)
習題5
第6章 大數(shù)據(jù)分析與挖掘
6.1 大數(shù)據(jù)分析概述
6.1.1 大數(shù)據(jù)分析的概念
6.1.2 大數(shù)據(jù)分析的類型
6.1.3 大數(shù)據(jù)分析的內(nèi)容
6.1.4 大數(shù)據(jù)分析的方法
6.2 大數(shù)據(jù)挖掘概述
6.2.1 數(shù)據(jù)挖掘介紹
6.2.2 數(shù)據(jù)挖掘應用
6.3 數(shù)據(jù)挖掘算法
6.3.1 K-Means算法
6.3.2 決策樹算法
6.3.3 KNN算法
6.3.4 遺傳算法
6.3.5 神經(jīng)網(wǎng)絡算法
6.4 實訓 繪制決策樹
本章小結(jié)
習題6
第7章 大數(shù)據(jù)可視化
7.1 大數(shù)據(jù)可視化概述
7.1.1 大數(shù)據(jù)可視化的概念
7.1.2 大數(shù)據(jù)可視化的流程
7.1.3 大數(shù)據(jù)可視化圖表
7.2 大數(shù)據(jù)可視化方法
7.2.1 文本可視化
7.2.2 網(wǎng)絡可視化
7.2.3 空間信息可視化
7.3 大數(shù)據(jù)可視化工具
7.3.1 Excel
7.3.2 ECharts
7.3.3 魔鏡
7.4 大數(shù)據(jù)可視化技術(shù)的應用
7.4.1 大數(shù)據(jù)可視化的應用場景
7.4.2 大數(shù)據(jù)可視化技術(shù)的行業(yè)應用
7.5 實訓1 閱讀并分析大數(shù)據(jù)可視化圖表
7.6 實訓2 上網(wǎng)查找大數(shù)據(jù)可視化資料
7.7 實訓3 繪制流程圖
7.8 實訓4 繪制可視化圖表
本章小結(jié)
習題7
第8章 大數(shù)據(jù)安全
8.1 數(shù)據(jù)安全概述
8.1.1 數(shù)據(jù)安全的定義
8.1.2 數(shù)據(jù)安全的特點
8.2 大數(shù)據(jù)時代的安全挑戰(zhàn)與解決
8.2.1 大數(shù)據(jù)安全面臨的主要威脅
8.2.2 大數(shù)據(jù)安全的關(guān)鍵技術(shù)
8.3 實訓1 Office文檔加密
8.4 實訓2 IPC$入侵
本章小結(jié)
習題8
第9章 大數(shù)據(jù)的行業(yè)應用
9.1 旅游大數(shù)據(jù)
9.1.1 旅游大數(shù)據(jù)的發(fā)展
9.1.2 大數(shù)據(jù)對旅游行業(yè)的影響
9.1.3 大數(shù)據(jù)在旅游行業(yè)中的應用
9.1.4 旅游大數(shù)據(jù)的應用場景
9.1.5 旅游大數(shù)據(jù)的實現(xiàn)
9.1.6 旅游大數(shù)據(jù)面臨的問題
9.2 教育大數(shù)據(jù)
9.2.1 教育大數(shù)據(jù)概述
9.2.2 教育大數(shù)據(jù)的實現(xiàn)
9.2.3 數(shù)字化校園
9.2.4 教育大數(shù)據(jù)的應用實例
9.3 金融大數(shù)據(jù)
9.3.1 金融大數(shù)據(jù)概述
9.3.2 金融大數(shù)據(jù)的應用
9.3.3 金融大數(shù)據(jù)的發(fā)展趨勢
9.3.4 金融大數(shù)據(jù)面臨的問題
9.4 實訓1 分析大數(shù)據(jù)在旅游業(yè)中的作用
9.5 實訓2 分析大數(shù)據(jù)在金融業(yè)中的作用
9.6 實訓3 畫出大數(shù)據(jù)的用戶畫像
本章小結(jié)
習題9
第10章 大數(shù)據(jù)綜合實訓
10.1 Linux操作系統(tǒng)的安裝
10.2 數(shù)據(jù)倉庫的簡單應用
10.2.1 使用Kettle工具寫入日志
10.2.2 使用Kettle工具連接不同的數(shù)據(jù)表
10.2.3 使用Kettle工具過濾數(shù)據(jù)表
10.3 繪制社交網(wǎng)絡圖
參考文獻